6月1日,阿里云峰會·粵港澳大灣區分會在廣州隆重舉行,AI大模型仍是峰會重要話題。繼發布“通義千問”大模型之后,阿里云在本場峰會上又秀出了最新成果:“通義聽悟”AI大模型正式上線,主要提供音視頻內容轉寫、檢索、摘要整理等服務,聚焦音視頻內容賽道。
據悉,“通義聽悟”是國內首款開放公測的大模型應用產品,能充當各行業從業者的AI助手。阿里云CTO周靖人在會上表示,“通義聽悟”瞄準的音視頻內容賽道具有較高知識附加值,應用范圍十分廣泛。包括日常開會、教學、訪談、培訓、面試和直播等場景,“通義聽悟”都能通過自身技術提高用戶工作效率。
比如在會議場景中,可以智能總結發言人觀點、生成會議記錄和統計待辦事項。在教學場景中,該產品則具備直接抽取視頻內的PPT截圖、提供實時翻譯和章節回顧等功能。更重要的是,“通義聽悟”這才剛剛上線,之后將會繼續優化,提供更多定制化功能。

對于這款全新的大模型產品,阿里云CTO周靖人表示十分滿意,并對其應用前景充滿信心。
根據周靖人介紹,“通義聽悟”集成了阿里云最先進的語音、語言技術,包括自研的語音語義多模態算法、新一代阿里工業級語言識別模型等,都在“通義聽悟”中得到應用。此外,“通義聽悟”還將和阿里云盤全面打通,支持轉寫內容直接上云,為用戶提供更大的儲存空間。
花了那么多資源、精力開發“通義聽悟”,阿里云的最終目的是惠及更多行業、企業,為數字經濟的發展出一份力。目前,“通義聽悟”已全面開放公測,公測期間阿里云官方微博、微信和各大平臺會發放大量轉寫口令碼,用戶的權益可以疊加、累積,服務免費時常將達到100小時以上。
正如周靖人所說,“通義聽悟”可以讓音視頻閱讀、整理、分享變得更輕松,為各個行業打開通往AI的大門。

從產品形態來看,科大訊飛旗下的“訊飛聽見”語音平臺是阿里“通義聽悟”的子集。“訊飛聽見”目前較多被媒體人等文案工作者應用,比如用來進行采訪錄音速記的文字轉寫提取。不過,阿里云“通義聽悟除了能進行音頻內容處理外,還能處理視頻內容。

還有一點區別是,“訊飛聽見”是深度學習AI時代的產品,“通義聽悟”則是大模型時代的應用。“訊飛聽見”目前采取收費模式,轉寫30分鐘大概需要10元左右的成本,用戶也可以通過購買小時卡、月卡會員等方式獲得語音轉寫時長。

作為后來者,“通義聽悟”采取了半免費的策略,公測期用戶每天可以獲得2小時轉寫時長,每邀請一名用戶還可以獲得2小時時長,顯然,“通義聽悟”希望通過裂變的方式去獲取用戶,以“半免費”的模式推動大模型AI產品普及,至于賺錢多少其實不重要,因為這樣的產品即便收費賺到的錢在阿里云的營收規模前可能連“蚊子肉”都算不上,阿里云也無意通過C端消費者賺錢,做產業數字化和智能化升級的基礎設施才是它要做的事情。

事實上,早在發布“通義聽悟”之前,阿里云就已經為數字經濟的發展做出了很大貢獻。
在粵港澳大灣區分會場,阿里云首席商業官蔡英華也公布了一組數據:截止目前,阿里云已經服務粵港澳大灣區近75萬付費客戶,包括金融、政務、水利、制造等行業,幫助無數中小企業實現數字化升級轉型。以制造業為例,阿里云工業互聯網全國總部就落戶在廣東,扶持了當地超過500家制造企業上云。
展望未來,在“通義聽悟”等AI大模型產品面世后,相信阿里云的數字服務能力將進一步加強,并給更多企業帶去幫助。
評論 {{userinfo.comments}}
{{child.content}}



{{question.question}}
提交