发米下载:值得大家信赖的游戏下载站!
发布时间:2025-07-17 07:00:33来源:发米下载作者:zhoucl
米斯特拉尔 宣布发布一种名为 Voxtral 的新型音频 AI 模型。 这家法国人工智能公司表示,该模型面向企业,被认为是第一个专注于音频人工智能的大型语言模型(LLM)系列。
据这家法国人工智能公司称,Voxtral 旨在在实际应用中提供实用的语音智能。该 AI 音频模型的性能优于顶级开源音频转录模型之一 Whisper large-v3。
Voxtral 由大型语言模型 (LLM) Mistral Small 3.1 提供支持。该音频 AI 模型可以理解多种语言,例如英语、法语、西班牙语、葡萄牙语、意大利语、德语、荷兰语、印地语等。
该音频模型能够转录长达 30 分钟的音频。此外,Voxtral 还能理解长达 40 分钟的音频,方便用户轻松交谈并提出相关问题。用户还可以要求其生成音频文件的文本摘要,或提供分析和详细见解。此外,他们还可以执行其他操作,例如通过 API 调用运行函数。
MistralVoxtral 提供两种版本的“语音理解模型”,分别为 Voxtral Small 和 Voxtral Mini。两种模型均能够与基于语音的提示或基于音频和文本的提示组合进行交互。
两种模型中,功能更强大的 Voxtral Small 具有 240 亿个参数,非常适合生产规模部署。Mistral写道“Voxtral Small 在所有任务上都与 GPT-4o-mini 和 Gemini 2.5 Flash 具有竞争力。”
Voxtral Mini 是一款轻量级的方案,拥有 3B 参数,是本地和边缘部署的理想之选。其 API 版本 Voxtral Mini Transcribe 不仅经济高效,而且性能优于 OpenAI 的 Whisper,价格不到后者的一半。
Voxtral Small (24B) 和 Voxtral Mini (3B) 均可从 Hugging Face 下载并本地托管。开发者还可以通过单个 API 调用将音频模型集成到任何应用程序中。起价为每分钟 0.001 美元,这使得转录可扩展。Mistral 表示,Voxtral 将在勒查特未来几周内将在网络应用程序或移动应用程序中推出。
Mistral 是欧洲领先的人工智能公司之一。据报道,该公司成立于 2023 年,已从 Andreessen Horowitz、Nvidia、三星和 Salesforce 等知名公司筹集了超过 10 亿欧元(约 12 亿美元)的资金。
KEY 差异线:加密货币项目用来获得媒体报道的秘密工具
ok交易所app下载(安全稳定交易通道)V6.18.32
美媒:宾夕法尼亚州一个县缺少数千张选票
数据突破 | 波场TRON账户总数突破2.7亿
币圈品牌营销只能靠复制别人的成功吗?
Anthropic CEO:人工智能最早可能在2026年达到“人类水平”
马斯克领导的政府效率部(D.O.G.E)官方X账号已上线
欧意交易所下载安卓版 v6.1.15_华为欧拉镜像下载
OK Vnturs合伙人Jff Rn主持Aptos princ圆桌论坛 聚焦亚太地区Wb3发展潜力
最安全的柴犬币商城下载 最好的加密货币交易APP安卓榜单