fine tuning機器學習的問題,透過圖書和論文來找解法和答案更準確安心。 我們找到下列包括價格和評價等資訊懶人包

淡江大學 資訊管理學系碩士班 張昭憲所指導 田家豪的 線上社群發文之複合情緒分析 (2021),提出fine tuning機器學習關鍵因素是什麼,來自於情緒分析、情緒模型、BERT、網路社群。

而第二篇論文國立陽明交通大學 人工智慧技術與應用碩士學位學程 簡仁宗所指導 張哲瑋的 具注意力之變異狀態追蹤器應用於語言視覺導航 (2021),提出因為有 語言視覺導航、變異推論法、注意力神經網路、部分可觀察馬可夫決策過程、強化學習、經驗回放的重點而找出了 fine tuning機器學習的解答。

接下來讓我們看這些論文和書籍都說些什麼吧:

除了fine tuning機器學習,大家也想知道這些:

線上社群發文之複合情緒分析

為了解決fine tuning機器學習的問題,作者田家豪 這樣論述:

網路社群蓬勃發展有目共睹,已成為現代人生活的一部分。大多數人除了在其中閱讀他人文章外,也會透過發文抒發己見,甚至發洩情緒。因此,社群成員情緒的監測便成為管理者的重要課題之一。管理者雖可觀察討論區中的發文獲得相關資訊,但由於資料量過於龐大,上述方法不但曠日廢時,且準確性堪慮。因此,學者們便提出各種情緒偵測方法,分析討論區發文造成之情緒反應,以協助管理者早期發現並發展因應對策。前人研究提出之方法固然有效,但面對日益複雜的網路社群,仍有待改進之處。首先,相關研究經常使用正、負、中立等情緒做為分類標記,無法提供合理的分析結果。此外,前人研究已歸結出目前機器學習方式的三大問題: 分別是依賴大量訓練資料

、不同訓練導致結果不一致與推理過程的不透明。在運用器學習於情緒分析時,需有更精細的設計與考量。有鑑於此,本研究以發展更有效的情緒分析方法為目標,設計一套多維度情緒偵測方法-Dimensional Emotion Identification with Multi-BERT (DEIMB)。首先,我們採用考量人類感受之情緒沙漏模型(Hourglass of Emotions)來表示量化的複合情緒,讓文章標籤有更一致的定義,以提升情緒分析結果的解析度。為顧及更高解析的情緒維度,我們提出一套以Google BERT語意分析模型為基礎的情緒分析方法DEIMB。配合情緒沙漏模型,針對不同情緒維度分別建立

極性偵測模型與程度值偵測模型,最後再加以組合,以提供更具參考價值之複合情緒判別結果。為驗證提出方法之有效性,本研究以網路社群實際發文資料進行分析。經實驗結果發現,本研究提出方法能在情緒極性方面取得合理的準確率。此外,與傳統正負極性判別結果不同,研究之結果能提供更高解析複合情緒描述,有助於社群管理者深入了解發文者的心情。對於多維度情緒偵測而言,準確性雖不如預期,但具有較高的情緒解釋性,顯示此做法具有發展之潛力。

具注意力之變異狀態追蹤器應用於語言視覺導航

為了解決fine tuning機器學習的問題,作者張哲瑋 這樣論述:

近年有許多新興研究提出了處理機器人導航問題的方法,而語言視覺導航任務是其中最為現實的室內導航挑戰任務之一。這些方法中的大多數使用監督式學習將觀察直接映射到動作,或是利用基於策略的強化學習方法對預訓練的策略進行微調,抑或是基於模仿學習來解決語言視覺導航任務。語言視覺導航任務是一種離散控制任務,並且在這個任務中,從模擬器提供的觀察並不是完整的系統狀態。但傳統的強化學習是假設對於系統的觀察為一個符合馬可夫假設的系統狀態,因此並不能直接地用於此第一人稱視角的導航任務。在本研究,嘗試利用強化學習解決此導航任務,並將其視為一為部分可觀察馬可夫決策過程。為了能夠使用強化學習來解決部分可觀察馬可夫決策過程的

問題,一些方法遵循部分可觀察馬可夫決策過程的理論,成功地解決了一些非完美訊息的任務。儘管如此,這些方法中的大多數都適用於一些非現實的部分可觀察環境。例如:基於第三人稱視角機器人控制問題卻沒有提供實際測量值,或是提供部分畫面的電腦遊戲任務而沒有在每個時間點提供完整畫面。因此,本研究提出一種基於現代強化學習的方法來解決這類第一人稱視角並且真實的語言視覺導航任務。此任務在研究中將會被視為一種部分可觀察的問題。本研究中有三重新意。首先,我們提出了一個適合強化學習訓練的環境,可以用於在語言視覺導航任務中訓練策略函數。其次,本論文提出了具注意力之變異狀態追蹤器 (AVAST) 來推測環境的信念狀態,而不是

直接使用循環神經網絡聚合先前的觀察後的隱藏輸出作為環境狀態。與使用可能導致災難性遺忘的普通循環神經網絡不同,研究中所提出的狀態跟踪器使用變異型循環神經網絡和注意機制來估計置信狀態的分佈得以增強泛化的能力。因此,通過使用這種具注意力之變異狀態追蹤器,部分可觀察問題將可以簡化為一般馬可夫決策過程問題。第三,受到傳統強化學習理論的啟發,我們開發了一個簡單但有效的技巧,稱為帶有專家演示課程的循環經驗回放(RECED)。基於動態規劃的概念,若以終止狀態做為起點開始學習估計狀態價值表可以加快值表的訓練過程。因此,專家演示課程的技巧可以通過不同難度的課程幫助機器從終端狀態開始學習直到初始狀態。最後,本研究分

別使用競爭型雙重狀態動作價值學習和離散型柔性演員評論家演算法來引入了基於價值和演員評論家的強化學習方法,以與不同方法進行比較來評估本研究所提出的方法。根據實驗結果,可以發現本文提出的方法對比一些現有的方法具有較好的泛化性。