Git PTT的問題,透過圖書和論文來找解法和答案更準確安心。 我們找到下列懶人包和總整理

國立臺北護理健康大學 資訊管理研究所 祝國忠所指導 顏碩均的 基於小樣本數據建立標註模型-以社群貼文為例 (2021),提出Git PTT關鍵因素是什麼,來自於小樣本學習、特徵選擇策略、自然語言處理、文本分類。

而第二篇論文國立臺灣大學 地理環境資源學研究所 蔡博文所指導 鍾明光的 公民共構空間資訊對於環境經營管理之效益與限制 (2018),提出因為有 地理資訊科學、公民共構空間資訊、公眾參與地理資訊系統、地理群眾外包、地理公民科學、群眾外包地理知識的重點而找出了 Git PTT的解答。

接下來讓我們看這些論文和書籍都說些什麼吧:

除了Git PTT,大家也想知道這些:

基於小樣本數據建立標註模型-以社群貼文為例

為了解決Git PTT的問題,作者顏碩均 這樣論述:

背景動機:近年來網路上文本數據急遽增加,分析文本成為各產業的趨勢,現有的深度學習能靠著文本和標籤進行分類預測,但標籤通常以人工方式進行標註,大量的數據以人工標籤方式並不切實際。另外,深度學習網路皆由多層神經網路層組成,訓練龐大數據相當耗時,然而在沒有這麼多標籤的情況下要建立實時且準確的標註模型非常困難。目的:為解決上述問題,本研究以小樣本建立標註模型,分別以兩個面向解決此問題,分別是數據建模前的提前篩選以及深度學習之小樣本模型,設立兩項目標:1.使用抽樣策略,減少模型訓練時所需樣本數量2.使用小樣本建立標註模型時,選擇最佳的深度學習法作為建模方法。方法:本研究收集了2019-2020社群網站

PTT Prozac版上文章作為數據,並以該文章分類作為模型訓練時的標籤,刪除了兩個標籤以外的文章,另外,文章最大字數只擷取至512個字元,字數超過的文章只保留前512個字元。數據經篩選後留下了1680筆文章,將其拆分為訓練數據840筆和測試數據840筆。處理文章以文本表徵呈現使用了BERT作為萃取工具,將一篇文章以768維度表示,在訓練模型前,處理過後的樣本透過六種選擇策略(熵、吉尼係數、分群、熵+吉尼係數、熵+吉尼係數+分群、隨機)分別以不同數量進行樣本的篩選,最後在遷移學習、主動學習、多任務學習以及元學習上建立標註模型,所有模型的優化函數為Adam,損失函數為交叉熵,學習率3e-6,批次

大小8,以上數值在每個模型中迭代10次。並以準確度、F1分數、召回率以及精確度做為評估標準。因此每種標註模型將會產生120種結果,協助判別各種組合在小樣本上的優勢與劣勢。結果:以方法進行實驗產生的120種數值表示,事先進行數據選擇的準確度,能夠比隨機抽樣高上3個百分點,並且使用熵作為抽樣方法最為穩定;另外,四種標註模型中,以元學習的準確度最高,在完整數據建模的準確度84.64%之下,元學習僅使用20%的樣本建模,準確度可達到78.45%。討論與結論:研究發現使用熵進行數據選擇並以元學習訓練模型,只需20%的數據能夠達到完整數據建模準確度的9成,透過小樣本建模達到高水準的標註能力,除了能解決模型

的運算時間之外,人工介入標籤的行為也大幅減少,並且以元學習的特性來說,其模型的參數還可以應用在不同領域中,大幅減少在個別任務中重新訓練參數的繁雜步驟,而與元學習同樣使用額外數據集訓練的多任務學習準確度較低,與文獻顯示一致,多任務學習較易受到不同類型的任務所影響,因此以元學習建立小樣本模型最佳。未來以小樣本建模的問題應還會持續存在,若自然語言處理尚未出現新技術,建議可以多嘗試多種特徵選擇策略,在建立模型前就使用相對具有建模意義的數據,增加模型準確度。

公民共構空間資訊對於環境經營管理之效益與限制

為了解決Git PTT的問題,作者鍾明光 這樣論述:

本研究嘗試從地理資訊與社會 (GIS and Society) 的研究脈絡,檢視公眾參與地理資訊系統 (Public Participation GIS)、地理群眾外包 (Geo-Crowdsourcing) 以及地理公民科學 (Geographical Citizen Science) 等三種具有參與性質的空間資訊生產模式,及其所產製的公民共構空間資訊 (Citizen-contributed Geospatial Information, CGI),應用於環境經營管理時的效益與限制。由於CGI的產製與應用涉及社會參與 (social inclusion)、空間資訊科技 (geospati

al information technologies, GITs) 及知識生產 (knowledge generation) 等多重學理範疇。故本研究首先藉由耙梳現有文獻討論,以:創用者 (producer)、資訊內容 (contents)、工具/服務 (tool/service)、參與類型 (participation) 及知識解譯 (knowledge discovery) 等五個面向,建構一個 CGI 產製 (produce) 的分析架構。同時,為了探究 CGI 的流通應用 (circulate) 對環境經營管理的效益,本研究以三個實務案例為基礎,檢視不同產製機制下的 CGI 如何促進

環境經營管理時的議題釐清、知識生產與決策制訂,從而歸納 CGI 的應用潛力及限制。以下分別就產製以及流通等面向,說明本研究的發現。首先在 CGI 的產製機制上:創用者的角色具有多重性,並無法單純地以專家/常民的二分法進行解構,且不同的創用者在資訊建置的內容上,亦存有互補/協力關係;尤其,科技志工的角色浮現,也協助扮演了專家與長民間的橋樑。最後,創用者間的信任建構,更是促使 CGI 產製機制能夠持續運作的核心要件。此外,創用者在 CGI 產製程序中的參與類型是一個動態過程;創用者的參與程度除了個人動機之外,也常隨著議題的進展而有所提升,甚至有時會扮演產製機制的主導者。所以,一個良善的參與程序設計

,必須尊重創用者間的多元視角,建立彼此的信任與對話,才能確保 CGI 的成果品質。GITs 的適當選用,能提升創用者在環境資訊產製的能動性,亦會影響資訊產製的內容、效率及品質。GeoWeb 扮演了CGI 產製與視覺化的基礎設施 (infrastructure),其背景資料庫的豐沛度對資料的空間化具有明確效益,然而對 GeoWeb 的高度依賴,也讓 CGI 產製需面對商業機制的挑戰。此外,部分非結構化的在地知識如何賦予適當的空間屬性,以使其能與其他環境因子進行對話/比較,亦是 CGI 產製在 GITs 選用時所應注意的面向。CGI 的資訊內容橫跨了結構-非結構間的多重類型,而其資料意涵亦不能等同

視之。結構化的空間資料能快速地導入科學分析的模式中,從而解構現象分布的位置與變化趨勢。非結構化資料卻包含了更多創用者對於環境的觀察與表述,甚至具有更強的參與動機與意見訴求,需從社會面向細緻解析其內涵。在 CGI 的資訊解譯過程中,首要的課題就是資料品質的確保,而創用者的積極參與可協助建立資訊品質的管控機制與效率。同時,在資料開放性高與進用便利的前提下,創用者則有較高的參與度。此外,CGI 的資訊解譯涉及多樣性的空間分析方法,且其參數選用具有一定程度的專業性,非一般民眾可以涉入;所以,如何增進資料處理方法的透明性,並在參數選用上涵納在地的觀點,亦是後續 CGI 產製的挑戰之一。其次,在CGI 的

流通應用:因為 CGI 是一種經由公眾參與所產製的空間資訊,所以能在環境經營的場域中滿足科學資料與公眾參與的雙重需求;CGI 具現 (instantiate) 權益關係人的環境知識與發展意向,除能協助描述環境問題的區位,也能與其他環境資訊比對,促進問題辨識與後續策略的研擬。此外,在政策的施行與評估階段,持續進行的 CGI 產製與流通機制亦可以視為一種環境經營管理的效益評估,能有效協助權益關係人理解政策施作之後的影響,甚至進行另一波的問題辨識與政策修訂。CGI 做為一種具有社會意涵的空間資訊,其流通應用更可視為一個權益協商以及共識凝聚的過程;CGI 的流通應用,讓在地觀點/意見能夠實質進入決策的

程序與權力,甚至影響環境治理中的肯責 (accountability) 與成果分配,進而創造了環境治理品質的提升。然而,CGI 對於環境經營管理的影響,除了立基於資訊產製與流通的透明度,也需要透過持續的權益關係人參與、協商及培力過程,始能逐步落實於決策機制內。整體而言,本研究所提出的 CGI 產製分析架構,能用於系統性評估 CGI 產製在技術 (technical) 及社會 (social) 面向的特徵,掌握創用者動機 (motivation)、GITs應用與地理知識生產間的連動關係,進而協助釐清 CGI 產製特徵對於的資料品質 (quality) 及可用性 (usability) 的影響。立

基於前述的產製分析,本研究的流通分析架構,則進一步協助描繪 CGI 的資訊內容與特質,如何能藉由 GITs的視覺化再現,以嵌入現有的環境經營管理機制,並影響權益關係人的知識及意見整合,並從而呈現 CGI 在環境資源經營管理的應用潛力。