科大讯飞Spark认知模型连夜升级，具备语音合成功能

时间：2023-10-12 18:31:43 阅读：次来源：网络整理

4日，科大讯飞官方公众号宣布讯飞星火认知大模型官网上线之后，已陆续有AI圈内人士、自媒体发布了内测体验报告，从各家综合反馈来看，讯飞星火认知大模型在语言理解、文本生成、逻辑推理、多轮对话方面表现值得期待，但目前还不支持图片生成等多模态内容形式。...

继4月24日科大讯飞官方账号宣布上线科大讯飞Spark认知大模型官网后英语培训，AI圈人士和自媒体纷纷发布内测体验报告。从各家公司的综合反馈来看英语在线朗读器讯飞，科大讯飞Spark认知大模型在语言理解、文本生成、逻辑推理、多轮对话等方面的表现值得期待，但目前不支持多模态内容形式比如图像生成。 4月27日上午，科大讯飞正式宣布语音合成功能已在大型机型上上线。官网上线仅3天就连夜升级。迭代速度“显而易见”。

讯飞在线朗读引擎_讯飞朗读app_英语在线朗读器讯飞

在科大讯飞Spark模型对话界面中，AI生成的回复内容下方有一个“播放按钮”。单击播放按钮即可对生成的内容进行语音报告。小编分别对数学公式和英语答案进行了测试，比如介绍“椭圆公式”时方程的阅读，以及英文长文本的阅读。 Spark模型整体可以自然流畅。小编认为，语音合成上报功能的推出英语在线朗读器讯飞，丰富了大模型的交互方式，拓宽了其场景应用的边界。比如出国旅游时英语培训，可以通过大模型的文本生成+翻译+播音直接问路。、咨询等现场问题。

讯飞在线朗读引擎_英语在线朗读器讯飞_讯飞朗读app

讯飞朗读app_讯飞在线朗读引擎_英语在线朗读器讯飞

据悉，科大讯飞Spark机型的语音播报采用了最新的语音合成技术——SMART-TTS英语在线朗读器讯飞英语在线朗读器讯飞科大讯飞Spark认知模型连夜升级英语培训，具备语音合成功能，可以提供“开心、抱歉、撒娇、严肃、悲伤、困惑、害怕、鼓励、愤怒、安慰、宠溺”。《溺水》共有11种情绪。每种情绪都有40级不同强弱的调解能力，赋予声音“喜怒哀乐”的特征，使合成的语音更加自然真实。

按照计划，科大讯飞将于5月6日正式发布科大讯飞“Spark”认知大模型，并发布面向教育、医疗、办公、汽车等行业的专业化大模型解决方案。到时候会有多少惊喜呢？，我们拭目以待。