科大讯飞Spark认知模型连夜升级,具备语音合成功能
4日,科大讯飞官方公众号宣布讯飞星火认知大模型官网上线之后,已陆续有AI圈内人士、自媒体发布了内测体验报告,从各家综合反馈来看,讯飞星火认知大模型在语言理解、文本生成、逻辑推理、多轮对话方面表现值得期待,但目前还不支持图片生成等多模态内容形式。...
继4月24日科大讯飞官方账号宣布上线科大讯飞Spark认知大模型官网后英语培训,AI圈人士和自媒体纷纷发布内测体验报告。 从各家公司的综合反馈来看英语在线朗读器讯飞,科大讯飞Spark认知大模型在语言理解、文本生成、逻辑推理、多轮对话等方面的表现值得期待,但目前不支持多模态内容形式比如图像生成。 4月27日上午,科大讯飞正式宣布语音合成功能已在大型机型上上线。 官网上线仅3天就连夜升级。 迭代速度“显而易见”。
在科大讯飞Spark模型对话界面中,AI生成的回复内容下方有一个“播放按钮”。 单击播放按钮即可对生成的内容进行语音报告。 小编分别对数学公式和英语答案进行了测试,比如介绍“椭圆公式”时方程的阅读,以及英文长文本的阅读。 Spark模型整体可以自然流畅。 小编认为,语音合成上报功能的推出英语在线朗读器讯飞,丰富了大模型的交互方式,拓宽了其场景应用的边界。 比如出国旅游时英语培训,可以通过大模型的文本生成+翻译+播音直接问路。 、咨询等现场问题。
据悉,科大讯飞Spark机型的语音播报采用了最新的语音合成技术——SMART-TTS英语在线朗读器讯飞英语在线朗读器讯飞科大讯飞Spark认知模型连夜升级英语培训,具备语音合成功能,可以提供“开心、抱歉、撒娇、严肃、悲伤、困惑、害怕、鼓励、愤怒、安慰、宠溺”。 《溺水》共有11种情绪。 每种情绪都有40级不同强弱的调解能力,赋予声音“喜怒哀乐”的特征,使合成的语音更加自然真实。
按照计划,科大讯飞将于5月6日正式发布科大讯飞“Spark”认知大模型,并发布面向教育、医疗、办公、汽车等行业的专业化大模型解决方案。 到时候会有多少惊喜呢? ,我们拭目以待。
猜你喜欢
发表评论
评论列表