使用 ML.NET 將文字轉成向量

現在越來越多場景需要藉助向量分析,最常見的情境莫過於將文字向量化之後,用於搜尋、聚類分析、建議等等,這篇要介紹如何使用 ML.NET 將文字轉成向量。

在 Visual Studio 中使用 HTTP 檔案呼叫 Web API

在開發 Web API 的應用程式時,經常會需要測試 API 的呼叫,這時候可以使用功能齊全的 Postman 來協助我們測試。如果你是使用 Visual Studio 來開發的時候,在 2022 的版本中,內建了 HTTP 檔案功能,我們可以在 Visual Studio 中直接執行這個檔案來測試 Web API 的呼叫。

使用 C# 來計算發送 OpenAI GPT 請求會使用到的 Token 數量

不管你是直接使用 OpenAI 的 API 還是使用 Azure OpenAI 的 API,在呼叫 AI 模型的時候,都是按照請求的 Token 數量來計算費用的,雖然在呼叫之後所回應的內容會告訴你這次請求使用了多少 Token,不過一般來說,我們還是會希望在發送請求之前,先計算這次請求會用到多少 Token,一方面控制使用量,二方面可以確保所發出的請求不會超過該模型能接受的上線。

在安裝 Zscaler 的電腦上執行 pip 安裝 Python 套件

Python 的開發者應該都知道 Python 安裝套件時,是使用 pip install package 的指令,但是在企業內部環境中,網路可能會因為一些設定而無法直接使用此指令安裝套件,例如因為無法合法的辨識 Zscaler 中繼憑證,而導致無法成功安裝 Python 套件,這篇提供一個方法來解決這個問題。

取得 HttpClient 的回應時間

在開發 Web API 時,有時候會需要知道每次呼叫該 API 時的網路狀況,例如:網路速度、網路狀況等等,如果想要知道該次呼叫的回應時間,可以搭配使用 Stopwatch 來計算,這篇是段簡短的範例程式碼,讓我們使用 HttpClient 的時候,同時取得回應訊息以及回應時間。

處理 Azure Storage Explorer 遇到 ZScaler 的憑證問題

透過 Azure Storage 可以建立大量資料的儲存服務,而且我們可以使用 Azure Storage Explorer 來管理存放在上面的各種檔案資料,相當方便。在有使用 ZScaler 服務的企業內部網路時,有可能會遇到對外連線的時候,被 ZScaler 抽換 SSL 憑證,造成無法正確處理連線的問題,這篇文章將介紹如何解決這個問題。

使用 PowerShell 將 doc 轉檔成 docx 格式

在整理過去的文件時,發現有大量的 Word 文件是使用舊的 .doc 格式,為了能夠在新的系統上使用,需要將這些文件轉換成新的 .docx 格式,這篇文章將介紹如何使用 PowerShell 來批次轉換。

自動將 Obsidian 筆記備份到 Github 並和行動裝置同步

Obsidian 是一套相當不錯用的筆記系統,在許多人的推薦下,我也來嘗試使用這套工具來處理四散各地的筆記。在使用的過程中,官方有推出一個 Obsidian Sync 幫你同步電腦和行動裝置上的筆記,收費並不便宜。幾經探索,整理出一套免費的解決方案,雖然方法比較工程師一些,但是會看到這篇文章的,應該滿多都是工程師吧。

使用 AutoHotKey 將視窗固定在螢幕最上層

將視窗固定在螢幕最上層,可以讓視窗不會被其他視窗遮住,在需要持續查看某些資訊的時候,這功能會非常好用,但不是每個應用程式都有這樣的設定,不過如果你有使用 AutoHotkey 了話,可以簡單設定一行指令,讓需要這功能的應用程式也有同樣的功能。

序列化 Stream 格式的 JSON 資料

使用 API 的方式來取得 JSON 資料是現代化系統常見的方式,在接到 JSON 字串資料後,序列化成強型別的物件能讓後續處理變得容易,不過這樣的處理方式在大量資料的情境下,容易因為 JSON 字串資料的關係,造成記憶體耗用的比較兇,畢竟儲存字串本身會佔據記憶體空間。這時候如果在取回 HTTP Response 的時候,直接使用 Stream 的格式來處理 JSON 資料,就能有效的降低記憶體的使用量,這篇文章將會介紹如何使用 Stream 的方式來處理 JSON 資料。