不久前,我們收到一條公開點贊——
香港立法會主席梁君彥在社交平臺發文點贊的“智識聽”系統,是香港立法會與科大訊飛聯合打造的智慧謄錄系統。
“智識聽”深度適配立法會場景的實時字幕功能,運用科大訊飛中英粵混讀引擎,結合聲紋識別和字幕與幀畫面對齊壓制技術,實現會議直播中文字和視頻畫面的同軌顯示,公眾可通過實時字幕無障礙獲取政策資訊,沉浸見證民主議政的全過程。
今天給大家分享一下,這背后的故事。
香港立法會來了一位AI字幕君
香港立法會是中華人民共和國香港特別行政區的立法機關,根據 《中華人民共和國香港特別行政區基本法》設立,負責制定、修改和廢除法律,并監督政府工作。
第七屆立法會由90名議員組成,立法會在會期內通常逢星期三上午11時在立法會綜合大樓會議廳舉行會議,議員及官員可用普通話、粵語或英語發言,會議席上提供即時傳譯服務,并向公眾直播。
同時,立法會會議的過程會逐字記錄,一般被稱為議事錄,在立法會結束后向公眾發放。
以往,立法會一場會議從召開到向公眾發放議事錄大概需要7個工作日,信息發布稍顯滯后。
2022年,梁君彥得知科大訊飛作為內地人工智能領域的頭部企業,自2021年起開始承擔全國人大會議的相關語音轉寫工作,平均準確率高達96%。他召集立法會的同事,經過數次交流考察,與科大訊飛達成了合作計劃。
“智識聽”深度學習2.5億字語料、400小時音頻、20萬條香港特色關鍵詞,口音、新地名、混語發言實時適配,即使面對議員特殊口音或復雜地名也能高效處理。
目前,實時字幕的準確率達96%,通過幕后同事的即時修正,準確率通過人機結合可達99%。
“智識聽”實時字幕準確輸出
除了90名議員之外,立法會綜合大樓內還有議員辦事處職員和立法會秘書處職員等也要深度使用“智識聽”,約有1000名使用者。同時,立法會會議通過各種渠道向公眾直播,為數百萬香港民眾服務。
從此,香港朋友們都可以通過這位“AI字幕君”,及時見證立法會全過程了。這標志著香港立法公開透明化邁出關鍵一步,也為粵港澳大灣區數字政務建設樹立了新標桿。
實時字幕更準了
議事錄發放更快了
“智識聽”正式調研、研發、上線歷時近三年,從1.0版本的錄音轉文字到2.0版本的實時轉文字,再到3.0版本的實時字幕,背后是合作雙方的共同努力。
“智識聽”項目初始,粵語的識別率不太高。
一是因為立法會議員使用的粵語俚語和法律專業術語較多; 二是因為部分議員的粵語有口音,既有老香港口音,也有廣東等各地方言口音; 三是大家的語言習慣是中英粵混雜,導致機器識別率降低。
怎么辦?為了解決這一問題,立法會秘書處整理了2.5億漢字的中英文對照和20萬個高頻粵語詞匯,將其作為語料庫提供給機器學習。經過數據和算法的優化和不斷的訓練,立法會會議實時字幕的準確率達96%。
會議的逐字記錄效率也因此項技術的落地大幅提升。原先,需要7個工作日才能發布的議事錄,會議召開后第二天即可發布。
梁君彥多次在社交媒體推介“智識聽”系統,并在采訪中表示要將其推薦給英聯邦國家。他說:“科技是時代的高鐵,你如果上不去,就會被社會的發展拋下。這幾年,內地在人工智能領域的發展日新月異,香港也不能掉隊,要積極與內地科技企業合作,推動立法會智慧化轉型。”
智識聽的背后是“實戰”經驗豐富的訊飛聽見多語種會議系統。
科大訊飛項目經理張坤介紹:訊飛聽見多語種會議系統,已服務全國人民代表大會4年,服務中國人民政治協商會議7年。
在2025年的十四屆全國人大三次會議上,提供了160套智慧簡報系統,服務34個代表團,完成1290小時會議記錄和轉寫1875萬字,識別率96.2%;在全國政協十四屆三次會議上,提供了60套智慧簡報系統,支撐372場分組會議,覆蓋58個界別。
張坤透露,目前智識聽四期正在準備中,該期將建設英語字幕和多語種字幕系統。同時,基于星火大模型的進步,香港立法會的智慧辦公系統也提上日程。
香港作為科大訊飛國際化戰略的重要橋頭堡,是多語言場景的最佳試驗場。科大訊飛在港將有越來越多的AI應用,助力打破語言壁壘,助力世界溝通!
-
AI
+關注
關注
91文章
39754瀏覽量
301345 -
科大訊飛
+關注
關注
19文章
860瀏覽量
63708
原文標題:香港立法會來了一位AI字幕君
文章出處:【微信號:iFLYTEK1999,微信公眾號:科大訊飛】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
科大訊飛明確2026年戰略方向與關鍵行動
科大訊飛設立子公司:加碼AI與集成電路業務布局
2025科大訊飛全球1024開發者節科博展開幕
回顧科大訊飛26周年慶精彩瞬間
科大訊飛聯手“挑戰杯”加速國產算力應用
科大訊飛加速東南亞企業的人工智能應用
科大訊飛亮相第137屆廣交會
科大訊飛深度解析DeepSeek-V3/R1推理系統成本
香港立法會與科大訊飛聯合打造智慧謄錄系統“智識聽”
評論