国产成人精品一二区熟女,伊人伊成久久人综合网,久久春色

復旦大學自然語言處理實驗室桂韜、張奇課題組發布信息抽取統一大模型 Instruct-UIE，在領域大模型上取得突破性進展。Instruct-UIE 在信息抽取精度上全面大幅度超越ChatGPT以及基于預訓練微調的單一小模型。

自2022年11月 ChatGPT 橫空出世以來，其在對話、閱讀理解、對話、代碼生成等方面優異性能，受到了極大的關注。大模型所展現出來的長文本建模能力以及多任務統一學習能力使得自然語言處理范式正在發生快速變革。

在對 GPT 系列工作進行了詳細分析[1][2]后，我們發現雖然 ChatGPT 在很多任務上都展現出了良好的性能，但是在包括命名實體識別、關系抽取、事件抽取等在工業界有廣泛應用的信息抽取任務上效果卻亟待提升。ChatGPT 在某些命名實體識別數據集合上的的精度甚至只有不到20%。但是大模型所展示出來的多任務統一學習能力，驅使我們針對信息抽取領域的統一大模開展了深入研究。

實驗結果

針對信息抽取任務，我們收集了包括 ACE 2005、ConLL 2003 等在內的41種評測集合，針對Flan-T5、Bloomz、LLama 等大模型進行了系統研究，構建了信息抽取統一大模型Instruct-UIE。該模型在絕大部分信息抽取任務中（85%以上）都超越了單個小模型的預訓練微調結果。

Instruct-UIE 統一了信息抽取任務訓練方法，可以融合不同類型任務以及不同的標注規范，統一進行訓練。針對新的任務需求，僅需要少量的數據進行增量式學習，即可完成模型的升級。

小模型時代任務，模型開發需要經過標注數據，訓練模型，模型評測和模型部署等多個步驟。其顯著缺點是成本高、時間周期長；相同任務的微小需求變化，需要30%-70%的重新開發成本；模型開發和維護成本高等問題都極大地制約了自然語言處理產品化。

而在大模型時代，我們可以將大量各類型任務，統一為生成式自然語言理解框架，并構造訓練語料進行微調。由于大模型所展現出來的通用任務理解能力和未知任務泛化能力，使得未來自然語言處理的研究范式進一步發生變化。這樣的研究范式使得小模型時代所面臨的問題可以在一定程度上可以得到解決。針對新任務和需求，基于大模型的方法可以快速訓練，并且不需要部署新的模型，從而實現自然語言處理的低成本產品化。