Navtalk —— breaking through the traditional digital human technology
Navtalk 是一款革命性的实时虚拟数字人平台,整合 计算机视觉、语音交互和智能决策 三大核心技术,提供全栈式解决方案。其五层架构支持 多模态渲染、实时交互、AI 决策、音视频同步及低延迟传输,具备 10+预设形象、50+语言实时转录、2000ms内响应 等能力,并实现 30FPS/4K画质 的流畅输出,即将正式发布。
EasyOne——突破AI多模态极限
EasyOne 是一款基于 LangGraph 多代理系统 开发的跨模态 AI 插件,整合文本、图像、音频和视频处理能力,通过 Multi-Agent 架构 实现高效任务调度与多模态交互。其核心功能包括 ChatGPT 扩展(支持复杂任务调用)、实时数字人对话(低延迟语音与嘴型同步)及 跨平台兼容性(Web/桌面端)。系统采用 Supervisor 协调代理协作,结合 DAG 任务流 优化性能,并针对高并发、数据安全等挑战提供解决方案,旨在提供无缝的 AI 交互体验。
AI Order 一体化智能点餐系统
这篇文章介绍了AI Order语音点餐系统的核心技术、系统架构、项目难点及运行情况。核心技术包括Twilio云通信平台、Google Voice通讯服务、STT语音识别、主流AI模型、TTS语音合成、Stripe支付、云打印机和Vapi.ai语音AI平台。系统架构分为前端和后端,包含IVR点餐系统、菜单详情界面、订单详情界面、后台管理系统和菜品推荐系统。项目难点涉及高并发数据一致性、多语言开发和AI模型提示词优化。目前项目一期已成功上线,运行良好。
🧠奇思妙想
未读
把博客写进 AI 脑海:如何打造 Redis 知识代理?
🗓 初稿时间:2025 年 2 月 24 日 ✍️ 作者自述:写博客不是为了写作,是为了训练我的 AI 成为 Redis 专家 引言:技术的意义,不在炫技,而在闭环 在产品开发中,技术创新的价值,不在于“炫酷”,而在于“闭环”。 如果技术无法构建起一个正向回路 —— 用户问题 ➝ 解决方案 ➝ 持
🔥我的项目
未读
AI Helper 插件助手
AI Helper 3.0 正在开发中,博客将持续更新… 免费的都不试一下嘛?(AI Helper - Chrome Extension) (AI Helper - Edge Extension) 一、AI Helper快速了解 1、初次安装 &n
🗣️技术闲聊
未读
SpringBoot快速搭建线上日志
1.在需要的地方输出日志 Log.info() 2.将输出的日志写入文件 编写logback-spring.xml文件,唯一需要修改的是第11行的value值,自己选文件夹位置。最后放在项目resource路径下: <?xml version="1.0" encoding="UTF-8"?>
<!-
🗣️技术闲聊
未读
手动部署springboot+vue前后端分离项目
一、前置准备 1.项目本地能够跑通 项目本地没有bug。同时要注意两个细节: 前端发送请求,需要设置成服务器的ip地址,因此开发时就可以采用统一变量代替ip地址,以后也好修改。 具体操作如下: main.js 设置全局变量$baseUrl Vue.prototype.$baseUrl=process