日本團隊利用超算“富岳”開發大語言模型
JP-Home.com
【共同社5月11日電】東京工業大學、理化學研究所、富士通等的團隊10日發佈消息稱,運用超級計算機“富岳”獨立開發了日語能力出色的生成式人工智能(AI)基礎技術“大語言模型”。不僅企業與大學可下載使用,公眾也可通過富士通官網試用。
除了歐美與中國,日本的大學和企業也在推進大語言模型的開發。此次利用包括富岳在內的國產技術,還獨立彙總了用於學習的日語數據。該團隊認為,能夠消除海外模型被指“使用哪些數據如何開發存在不透明”的擔憂。
該團隊從互聯網文本數據庫中甄選高質量的日語文本。使用“富岳”推進AI學習,用不到1年時間完成開發。據稱,特點是能夠自然地處理敬語和以日本文化為背景的對話。
被稱為“圖形處理器”(GPU)的半導體適用於生成式AI開發,但美國英偉達等海外企業佔據了大部分份額,無法滿足全世界的需求。富岳不使用GPU,團隊此次優化了軟件,把中央處理器(CPU)的計算速度提高至6倍,展示了使用國產超算也能開發生成式AI。(完)
文章引用自 https://tchina.kyodonews.net/news/2024/05/22fe3fe3d036.html