天天操夜夜操时时操,中国精品视频一区二区,精品久久久日本综合电影

您是否曾經僅僅根據他們的聲音來構造一個從未見過的人的心理形象？人工智能（AI）現在可以做到這一點，僅使用簡短的音頻剪輯作為參考即可生成人臉的數字圖像。

這個名為“ Speech2Face” 的神經網絡（一種以類似于人腦的方式“思考”的計算機）經過科學家培訓，接受了來自互聯網的數百萬個教育視頻，顯示了100，000多個不同的人在說話。

研究人員在一項新研究中寫道，Speech2Face通過該數據集學習了語音提示與人臉某些物理特征之間的關聯。然后，AI使用音頻剪輯對與語音匹配的真實感面部建模。

值得慶幸的是，人工智能還不能僅僅根據他們的聲音確切地知道特定的人是什么樣。研究作者報告說，神經網絡識別語音中的某些標記，這些標記指向性別，年齡和種族，是許多人共有的特征。

科學家寫道：“因此，該模型只會產生看上去普通的面孔。” “它不會產生特定個人的圖像。”

盡管坦率地說，對貓的解釋有點讓人恐懼，但AI已經證明它可以產生出異常準確的人臉。

由Speech2Face生成的臉部-均面向正面并具有中性表情-與聲音背后的人并不完全匹配。但是，根據這項研究，這些圖像通常確實可以捕捉到正確的年齡范圍，種族和性別。

但是，該算法的解釋遠非完美。當面對語言變化時，Speech2Face表現出“混合表現”。例如，當AI收聽亞洲人講中文的音頻片段時，該程序會產生亞洲人臉的圖像。然而，據科學家報道，當同一個人用不同的音頻片段講英語時，人工智能產生了白人的面孔。

該算法還顯示出性別偏見，將低音調的聲音與男性面孔相關聯，將高音調的聲音與女性面孔相關聯。研究人員寫道，由于訓練數據集僅代表YouTube上的教育視頻，因此“并不代表整個世界人口。”

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI使用音頻剪輯對與語音匹配的真實感面部建模