科技日報訊 (記者馬愛平)記者5月12日從中國農業大學獲悉,該校生物學院王喜慶教授團隊聯合上海人工智能實驗室、崖州灣種子實驗室日前發布了我國首個種業大語言模型“豐登”。
“‘豐登’集成了人工智能模型‘書生·浦語2.0’與大數據分析技術。通過深入學習我國迄今發布的科研文獻、科技書籍、種企報告和歷史推廣數據,‘豐登’可準確解答有關作物品種在選育推廣、農藝性狀、栽培技術、推廣區域等方面的問題。”王喜慶告訴記者。
相較于國內外其他大語言模型,“豐登”重點關注生物育種領域。
據王喜慶介紹,該模型具有四大核心能力。首先,可系統深度挖掘并結構化我國育種領域積累的學術文獻、書籍、田間日志等知識。其次,可利用多學科知識圖譜,整合生物學、遺傳學、氣象學、土壤學等相關領域知識,并發掘這些領域知識之間的聯系。再次,能通過自然語言對話接口降低技術門檻,用戶可直接提出問題并迅速獲得答案,確保信息的實時性和高效獲取,提高工作效率。最后,它不僅服務于育種專家和科研人員,也能為全國農業工作者提供支持,加速育種知識的傳播和應用。
經評估測試,“豐登”在最佳答案個數和綜合分數上的表現均超出預期,在多個評估維度上超越了國際領先水平的大語言模型。
目前,“豐登”的首個重要版本——“豐登1.0”擁有超200億參數,并已開放針對水稻相關知識的測試接口申請。首批參與測試的單位包括中國科學院、中國農業科學院、上海市農業科學院、廣東省農業科學院、華中農業大學、華南農業大學、復旦大學等。