Meta发布人工智能平台,可以翻译近100种语言

2025-08-05 12:56来源:本站

  

  

  Facebook的母公司meta推出了一款人工智能翻译引擎,可以跨文本和语音翻译语言。

  该翻译平台名为SeamlessM4T,是“首个一体化多语言多模式人工智能翻译和转录模型”,meta表示。

  多模态引擎是那些从语音和文本中理解语言的平台,它们可以生成任意一种或两者的翻译。

  SeamlessM4T可以根据任务执行多达100种语言的语音到文本、语音到语音、文本到语音和文本到文本翻译。

  meta说:“与使用独立模型的方法相比,SeamlessM4T的单一系统方法减少了错误和延迟,提高了翻译过程的效率和质量。”

  “这使得说不同语言的人能够更有效地相互交流,”它补充说。

  人工智能翻译产业正在蓬勃发展。

  根据印度Acumen Research and Consulting的数据,到2030年,全球机器翻译市场规模预计将从2021年的8.126亿美元达到近41亿美元。

  机器翻译是使用软件将文本或语音从一种语言翻译成另一种语言的过程。

  meta表示,它将根据研究许可公开发布SeamlessM4T,以允许研究人员和开发人员在此基础上进行开发。它还发布了SeamlessAlign的元数据,这是迄今为止最大的开放多模态翻译数据集,总共挖掘了27万小时的语音和文本对齐。

  新的翻译引擎具有近100种语言的语音识别能力。它可以为近100种输入和输出语言执行语音到文本的翻译。语音到语音的翻译可以在近100种输入语言和36种(包括英语)输出语言。

  此外,它还可以为近100种语言进行文本到文本的翻译,为大约100种输入语言和35种(包括英语)输出语言进行文本到语音的翻译。

  meta表示,SeamlessM4T是其创建通用翻译器努力的一部分。

  去年,meta发布了No Language Left Behind (NLLB),这是一个支持200种语言的文本到文本机器翻译模型。它已被整合到维基百科作为翻译提供商之一。

  去年10月,该公司发布了首个针对口语的语音到语音翻译系统。该系统是在meta的通用语音翻译项目下开发的,专注于开发人工智能系统,提供所有语言的语音到语音翻译。

  今年早些时候,该公司发布了大规模多语言语音,提供超过1100种语言的语音识别、语言识别和语音合成技术。

  meta说:“SeamlessM4T利用所有这些项目的研究成果,从一个模型中获得多语言和多模式的翻译体验,该模型建立在广泛的口语数据源上,具有最先进的结果。”

  SeamlessM4T还具有代码切换功能。当说多种语言的人在说话时使用多种语言时,就会发生这种情况。它允许引擎自动识别和翻译一种以上的语言,当混合在同一个句子中。

一物网声明:未经许可,不得转载。