不識吳誠文 AI缺本土語料 將建主權資料庫
隨科技發展全球邁入AI協作時代,AI主權議題也備受關注,民進黨立委陳培瑜8日在國科會立院報告中指出,大型語言模型因缺乏台灣本土語料,常出現「不認識台灣」的狀況,甚至連國科會主委吳誠文的資料都不齊全。吳誠文回應,已啟動規畫建置主權AI資料庫,研擬借助掌握史料的媒體將其內容數位化,進到台灣的語料庫協助各行各業。
陳培瑜表示,國際大型語言模型因嚴重缺乏台灣本土語料,常出現荒謬的「不認識台灣」,甚至吳誠文過往曾是少棒選手的資訊都無法掌握,但其實台灣擁有豐富的內容產業,如報紙、廣播、電影等,只要積極協助數位化、標籤化並建置台灣主權AI語料庫,就能夠避免在雲端世界被邊緣化。
民進黨立委伍麗華提到,社群媒體經常充斥AI生成的「模板文章」,雖以原住民為主題,卻使用錯誤圖像與嚴重文化挪用,導致AI持續複製錯誤認知、偏見甚至歧視,流量極大,對原住民族造成災難性影響,呼籲國科會在建置主權AI語料庫時,必須積極納入正確的原住民族知識權威語料,避免原住民族在數位時代更加邊緣化。
吳誠文回應,在資料建置方面已啟動相關規畫,研擬以科技預算協助媒體進行數位化,訓練後的模型將公開協助各行各業發展,而在產業協助方面,行政院已有決議,要協助中小企業打造主權AI模型、串聯供應鏈,同時將持續與產業溝通,並橫向聯繫各部會,針對不同規模企業提供客製化支援。
吳誠文另提到,供應給科學園區的能源至5月底仍充足無虞,且在天然氣調度方面,已由經濟部、中油等單位進行進口調度,因此即便至6月仍會有替代方案能因應;水資源方面,近期降雨已緩解先前水情,目前也處於穩定狀態。


