联网才是完全体 聆思CSK6 在线大模型功能体验

  • 来源:电脑报
  • 关键字:模型,功能,体验
  • 发布时间:2024-08-09 14:51

  ■ Jeff

  老固件需二维码配网,建议升级新固件

  想要调用线上大模型API,第一件事自然是联网,和我们已经习惯的“查找网络、输入密码、连接网络”套路不同,聆思CSK6 出厂固件不能自主搜索路由器SSID,长按烧录“大模型多模态”功能后,它会直接进入配网模式,需要用手机扫描它提供的二维码,再在手机上弹出的页面里填写无线网络的SSID 和密码。注意,聆思CSK6 的无线网卡只支持2.4GHz 频段的无线网络信号,最好先检查一下路由器设置再连接。

  填写完SSID 和密码后,在手机上又会生成一个二维码,此时回到CSK6 开发板,点击“已扫描二维码”就能开启摄像头,扫描手机上的二维码之后即可完成配网。但因为CKS6 开发板的摄像头分辨率较低,所以最好在光线条件较好的环境下进行拍摄,否则可能识别二维码都要花不少时间。好在最新版的固件已经升级了UI 配网功能,可以直接在开发板上选择网络,建议大家都赶紧升级。

  免费接入讯飞星火大模型,实用性大增

  配网完成后,在应用界面内它会自动对时,只要你看到时间显示正确了,那就说明配网成功了,而且它也有配网记忆功能,即便是烧录了其他应用后重新烧录“大模型多模态”也不再需要配网,这一点很方便。

  在联网模式下,聆思CSK6 AI 开发板默认调用讯飞星火大模型,通过呼叫“小美小美”来唤醒对话功能,因为是线上大模型,所以它能结合线上搜索功能做很多实时性的工作,比如询问天气、播报新闻等等,与只能基于训练数据回答问题的本地离线AI 有着本质上的区别,再加上此时的聆思CSK6 基本就成了一个端云之间的数据中转站,其性能表现纯粹只与网络速度挂钩,也体现了线上功能对于物联网端侧AI 设备是多么重要。

  我们实际测试了聆思CSK6 AI 开发板的线上对话功能,它的拾音表现比较稳定,即便在2 米开外也能准确识别,外置的扬声器效果也还凑合。这时候你可能会觉得它不就变成一个智能音箱了吗?从语音对话的角度来说确实没错,但注意人工智能大模型是具备多模态属性的,聆思CSK6 AI开发板不仅支持语音对话,还可以语音生成图片,比如我们对它说“画一个正在吃早饭的小男孩”,它就会按照字面理解,在短时间内生成照片。

  这还没完,聆思CSK6 AI 开发板的线上多模态功能除了对话与绘画之外,还有“拍照识图”功能,相较于它预装的那个简陋到错误百出的离线AI“拍照识图”,在线版的“拍照识图”不仅可以准确识别图中的物体是什么,有什么颜色,还能分辨背景环境,做出简要的分析。当然,这时候它那30 万像素摄像头就成了最大的瓶颈,很多识图错误往往都不是大模型的问题,而是照片实在不够清晰。

  通过这一番使用下来,笃定了端侧AI 硬件+ 线上大模型组合的正确性,对于聆思这块开发板而言,即便是在这个模式下,从实际应用来看,它欠缺的东西还是比较多,比如生成的图片、对话无法传递到手机端留存,也无法回溯对话历史信息……但考虑到它只是一个开发板,它的定位是整个物联网AI 设备的一个桥梁环节而已,只有当它的表现足够好的情况下,才会有效地将不同生态连接起来,以这个角度而言,它又算是做得还不错了。

  最重要的是,星火大模型的基础版Spark Lite API 已经全面免费开放,所以也不用担心大模型下架或被移除授权等问题。除此之外,聆思CSK6AI 开发板也支持云端大模型的自定义功能,下期我们将会着重为大家介绍如何调用自己想要的云端大模型API,实现大模型人设定制、知识库挂载、发音人调整等功能。

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: