AR眼镜+AI语音识别,这位斯坦福学霸让ChatGPT可以出门了!

215次阅读
没有评论

共计 1200 个字符,预计需要花费 3 分钟才能阅读完成。

许多人都沉迷于与 ChatGPT 闲聊,却忽略了它在现实生活中与其他人互动的潜力。

AR 眼镜 +AI 语音识别,这位斯坦福学霸让 ChatGPT 可以出门了!

但斯坦福大学的一个聪明学生 Bryan Hau-Ping Chiang(应该是韩国人或韩裔),发现了 ChatGPT 的新用途。

AR 眼镜 +AI 语音识别,这位斯坦福学霸让 ChatGPT 可以出门了!

这位集计算机科学和电气工程于一身的全能学霸,巧妙地将开源的 Monocle AR 硬件和 OpenAI 的 Whisper 自动语音识别(ASR)技术相结合打造了一副智能眼镜,使 ChatGPT 变得更具移动性和互动性。

AR 眼镜 +AI 语音识别,这位斯坦福学霸让 ChatGPT 可以出门了!

在智能手机的助攻下,这副智能眼镜被 Chiang 称为 rizzGPT(“Rizz”的意思是“魅力”,嘿嘿,多么狡猾的名字啊)!这让拥有 AI 聊天助手的 Chiang,顺利地应对了模拟工作面试、与朋友不期而遇和选择新餐厅最佳菜肴等各种挑战。

AR 眼镜 +AI 语音识别,这位斯坦福学霸让 ChatGPT 可以出门了!

Chiang 在推特上晒出 rizzGPT 使用指南时,自豪地描述这个系统为“由 AR + AI 推动的新时代环境计算的开端,人人皆可随时使用自己的私人助手”。斯坦福的这位学生还开玩笑说,rizzGPT 可以在尴尬的约会和工作面试等生活重大事件中大显身手,提供“实时魅力即服务(CaaS)”。

AR 眼镜 +AI 语音识别,这位斯坦福学霸让 ChatGPT 可以出门了!

Chiang 还为我们提供了一个极好的 rizzGPT 示例。在视频中,Chiang 戴着搭载离线式 Monocle AR 设备的眼镜框架,信手拈来地回答了一系列面试问题。Monocle 的内置显示屏给他提供了由 ChatGPT 生成完美答案的提示。

当 Chiang 与朋友不期而遇时,rizzGPT 系统为他提供了另一个私人互动场景。AI 通过照片识别了他的朋友,并能够辨认她。戴着 Monocle 的人可以根据与特定朋友的智能手机内信息生成相关的对话,这个功能可轻松应对“尴尬的约会”,让佩戴者轻松愉快的与约会对象交谈。然而,周围的人可能不会高兴看到你戴着眼镜扫描他们的脸并告诉你该说什么!嗯,这让人想起了 Google Glass 的影子。

将 AI 与 Monocle AR 结合的另一个绝妙例子是在餐厅提供菜单建议。在这个推特视频中,你可以看到 AI(无声地)为 Chiang 阅读菜单,并在被问及时,基于它所知道的他的口味、厌恶和营养价值提供一些建议。在这个现实世界的 AI 应用中,这位斯坦福大学的学生还利用了连接的语音转录、TTS(文本到语音)和 OCR(文字识别)服务。

如果你脑洞大开,想出了其他有趣的 rizzGPT 用法,请不要害羞,直接私信 Chiang,向他发送建议。谁知道呢,或许你的建议就能引领下一个 AI 热潮!

推特地址:https://twitter.com/bryanhpchiang

开源地址:https://github.com/acui51/monocle-rizz

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-04-22发表,共计1200字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。