第268章好多東西_離語-愛下電子書

第268章好多東西

當談到兩個給我留下深刻印象的APP時，我會選擇“Notability”和“Headspace”。以下是關於這兩個APP的基礎功能以及它們令人印象深刻的原因：

1.Notability

基礎功能：

Notability是一款功能強大的筆記應用，主要用於iPad和其他iOS設備上。它允許用戶創建、編輯和整理各種類型的筆記，包括手寫筆記、打字筆記、錄音筆記、圖片、PDF文件等。用戶可以通過各種顏色和工具來標記和強調筆記內容，還可以添加標籤、註釋和連結，使筆記更加有序和易於查找。此外，Notability還支持iCloud同步，用戶可以在多台設備之間無縫同步筆記內容。

印象深刻的原因：

強大的手寫識別功能：Notability的手寫識別技術非常出色，能夠準確地將手寫筆記轉換為可編輯的文本，大大提高了筆記的整理效率。

靈活的筆記組織方式：用戶可以根據個人喜好和需求，通過文件夾、標籤和搜索功能來組織和管理筆記，使查找和使用筆記變得更加便捷。

多樣化的內容導入與導出：Notability支持導入多種格式的文件，如PDF、圖片等，並可以將筆記導出為PDF、Word等格式，方便用戶與他人分享或打印。

優秀的用戶體驗：Notability的界面設計簡潔直觀，操作流暢，同時提供了豐富的自定義選項，滿足用戶個性化需求。

2.Headspace

基礎功能：

Headspace是一款專註於冥想和放鬆的APP，旨在幫助用戶減輕壓力、改善睡眠和提高專註力。它提供了多種冥想課程，涵蓋了從基礎入門到高級進階的各種主題和時長。用戶可以根據自己的需求和喜好選擇合適的課程，並跟隨專業指導進行冥想練習。此外，Headspace還提供了每日提醒、睡眠音樂和呼吸練習等功能，幫助用戶更好地融入冥想生活。

印象深刻的原因：

專業的冥想指導：Headspace的冥想課程由專業導師錄製，內容科學、系統，能夠引導用戶逐步進入冥想狀態，感受身心的放鬆和寧靜。

豐富的冥想主題：Headspace提供了多種冥想主題，如壓力緩解、睡眠改善、專註力提升等，滿足不同用戶的需求。同時，課程時長靈活多樣，方便用戶根據自己的時間安排進行練習。

簡潔直觀的用戶界面：Headspace的界面設計簡潔直觀，用戶可以輕鬆找到所需的功能和課程。同時，APP的音效和動畫效果也非常出色，為用戶營造了一個舒適、寧靜的冥想環境。

科學的數據跟蹤：Headspace會記錄用戶的冥想數據，如練習時長、課程完成情況等，並通過數據分析幫助用戶了解自己的冥想習慣和進步情況。這些數據可以作為用戶調整冥想計劃的參考依據。

隨後進行數據採集，爬取加人工採集。對兩種方式採集的文獻數據進行整理，將元數據記錄好，並統一格式，用於後續的檢索。最後是文獻的精細篩選。因為RAG技術就是要增加大語言模型在專業領域的可信程度，解決大語言模型的幻覺問題。那在數據的選取上就要偏向於更為全面的文獻數據。生命周期評價的本質是用來評估產品或服務從生產到消費再到廢棄的整個過程對環境和社會的影響，它考慮了資源使用、能源消耗、排放物的產生等方面。那麼為了提高最後基於電力LCA這個領域搭建的專業模型的準確度，對文獻進行精細篩選，選取同時包括流程圖，數據，各單元過程投入產出詳細數據，數據時間地點落去方法，技術細節的文獻，作為最終的數據。將精細篩選后的論文數據，結合unstructed庫進行數據處理。進行信息精細化拆解與清洗，使以pdf形式存儲的文獻數據通過分割，分區，變成便於嵌入模型的結構化數據。對文字進行篩選與清理，圖像的內容進行識別，存儲圖像的解釋信息，表格轉化為HTML格式。最後統一變成標題加內容的格式。在這裏我列舉了簡單的數據處理流程。首先是對數據進行分割。隨後是對文本進行拆分，識別內容是否為文本，如果是，就填進text_list。將表格轉化為HTML格式，將圖片變為圖片解釋信息。第二部分是知識庫的構建。向量知識庫，能將各類數據（如文本、圖像、音頻等）轉化為向量形式進行存儲。數據之間的相似性和關聯性得以量化，不像平時你存儲你的，我存儲我的，向量數據庫給予了一個統一的標準。也正是因為統一了格式，利用相似度對比，檢索更加高效。構建知識庫的流程首先是提取分割文本進行向量化的操作。向量化的本質是將離散的符號信息，如詞或句子，映射到連續的向量空間中，以便計算機能夠處理。向量化將高維數據轉化為低維數據，保留了數據的關鍵特徵又降低了數據的複雜度。選擇pipecone存儲向量數據，它支持查詢，插入，刪除等一些列操作。選擇weaviate作為向量搜尋引擎，可以通過主題的分類檢索，進行語義搜索、問答提取等等功能。第三部分是chatbot的構建。先前已經構建好了針對電力LCA領域的專業大模型，但是缺少檢驗模型的手段，即缺少模型優化環節，本項目設置通過Chatbot模式，通過與用戶進行問答的形式，檢驗模型是否能調用電力行業LCA領域向量數據庫回答該領域專業性問題和時效性問題的有效性。Chatbot是模擬人類對話的一種形式，就我們平時能使到的chatgpt就是以chatbot的形式來呈現的，而chatbot在這裏的功能實現主要是為了體現檢索功能，大致可分為知識庫檢索功能和在線搜索。那麼就產生了三種檢索模式。

僅基於大語言模型，連接知識庫搜索，和在線搜索。前端部分我採用streamlit來完成，UI設計如圖所示。這邊是功能按鈕，中間是對話框。先前有講到了，我們來檢測針對專業領域的大模型的標準就是檢測是否有能力回答專業領域的問題，並針對結果進行優化。這裏我向chatbot提出同一個問題。只採用大語言模型，採用知識庫與大語言模型結合，和聯網搜索與大語言模型結合。三種功能下獲得的回答是完全不同的，後面兩個檢索功能均為大語言模型優化了生成回答的準確性，對大語言模型的專業領域知識做了補充和改善。可以看到普通的大語言模型回答的是最簡短的，採用了知識庫的回答，將答案細分，擴充，並添加了新的內容，附上參考文獻。最後的聯網搜索，將答案分為了幾類，更加全面，但是每類回答點到即止。最後就是向量知識庫進行優化。對於準確率低的查詢，分析模型回應錯誤的原因。如果是由於知識庫中缺少相關信息，可以通過添加更多相關文檔和數據來增強向量知識庫的覆蓋範圍。用戶反饋是對輸入的問題和產生的回答進行記錄，方便針對性進行調整。反饋可以直接用於指導向量知識庫的更新和優化。不斷地測試來完善我的專業領域大模型。最後一部分是我本次研究的總結。首先創建了一個能被大語言模型直接調用的專業知識庫，在電力LCA這個專業性較高的領域填補了大語言模型的空白。其次是採用RAG技術，將知識庫，聯網與大語言模型相結合，增強了大語言模型在特定領域的可信度和實用性。最後就是本次研究雖然是針對電力LCA領域，但其背後的構架適用於各個領域，構建了一個完整的體系，可以進行修改，全方面的輔助大語言模型，應用廣泛。

第268章 好多東西