楼主小月:Hello大家!
今天,vivo应用商店上线了vivo看见5.0.1.0版本。我来给大家介绍一下本次发现的更新点:
首先,第1个变化是在开启问答后增加了说话打断功能。以前在问答过程中,若想打断模型的回答,必须点击停止;现在模型在回答时,只需说话就能打断。但问题也很明显,在嘈杂环境中,旁边有人说话就可能导致误打断。希望这个难题在后续版本中能得到优化,目前我个人觉得体验不太好。当然,同类产品也面临类似问题,比如豆包。
另一个新功能是记忆回溯。具体来说,打开问答后,在提问前,直接拿着手机绕周围转一圈,然后提问,例如“你都看到了些什么”,模型就能自动解析刚才镜头经过的所有画面,并解释给我们听。从某种角度看,这能帮我们快速熟悉周围环境,无需反复转圈询问。更大的作用是帮我们找物品,比如找杯子,以前得挪动镜头多次询问,现在如果认为杯子在某个区域,只需将手机在该区域移动一圈,然后询问“有没有看到杯子”,模型会记住10秒钟内镜头经过的画面,并告知是否看到杯子。这个功能用途是这样,但好不好用、是否实用,还需要大家在实际使用中检验。也希望大家把体验结果反馈到评论区,帮助团队改进这一功能。
针对大家经常反馈的,识别准确度问题,本次更新了一个云测大模型功能,通过云端的模型来辅助,使画面的描述更加准确,大家可以在实践中体验云策大模型。
除此之外,还有一些bug修复。之前有伙伴反映,描述完画面后,若画面中有文字,会收到“检测到文本”的语音提示,朗读检测到的文本稍显冗余,很多伙伴在评论区留言希望替换。在本次版本中,这一建议得到落实,将检测到文本的语音提示换成了“叮咚”音效提示,让信息反馈更高效及时。
此外,还有语速的跟随优化。先前不少伙伴说,即便调用vivo自带语音库,也存在语速无法跟随三方读屏的情况。在该版本中,语速可以跟随三方读屏调节,但目前仍只能调用vivo自带语音库,无法换成第三方的。
这次还规范了设置语速和发音人选择列表的控件,去除了已选和未选的冗余提示。
还有一些细节变化,比如点击拍照按钮后,再点击左下角的查看按钮,上一版本会进入相册首页,而在该版本中点击照片可直接进入照片详情页。
感谢vivo的同学一直以来对信息无障碍的关注,也期待后续版本能给我们带来更多贴近生活的帮助。如果大家有更好的建议或使用问题,欢迎在评论区留言,我