> 2024-08-15
杭州萌嘉网络科技有限公司(TorchV)联合创始人& CTO 肖玉民受邀参加2024年8月15日在上海举行的GOTC全球开源极客嘉年华x全球开源技术峰会,并做了主题分享《非结构化数据解析 & GenAI 的应用探索和实践》。
分享内容包括:
- 非结构化的数据处理,做RAG的产品迭代基本是从非结构化数据解析开始。那么这一节会围绕整个技术中间件的选型,包括PDF的表格解析等内容进行展开
- 企业AI场景落地,我们的产品应用探索和思考
- 创业总结和个人感想。
具体内容可查看https://torchv.com/blog/gotc
> 2024-06-29
杭州萌嘉网络科技有限公司(TorchV)创始人& CEO卢向东,在2024年6月29日上午在北京富力万丽酒店举行的稀土掘金开发者大会RAG专场分享了《RAG在企业应用中落地的难点与创新》。
分享内容包括:
- 难点1: 文件解析,以及PDF表格解析
- 难点2: 结构化数据融合
- 难点3: 索引过程中的其他工作
- 难点4: 检索中rerank的难点和解决
- 创新1: 在金融研报中的应用
- 创新2: 在零售中的创新
- 创新3: 在规则审批业务中的应用
- AI在应用落地中的三个特点
- 做产品和做服务的不同
具体内容可查看https://torchv.com/blog/xitu
直播回放:https://juejin.cn/live/594351
> 2024-06-15
杭州萌嘉网络科技有限公司(TorchV)联合创始人& CTO 肖玉民受邀参加Zilliz发起,在阿里巴巴西溪园区举办的Unstructured Data Meetup.
肖玉民结合萌嘉科技开发的TorchV Bot(基于RAG、大模型技术栈),结合企业客户的真实需求,探讨 RAG 技术在 Embedding、检索、生成等方面的技术细节,以及 TorchV 在落地过程中所面临的挑战与解决方案。肖玉民表示 TorchV 的基线产品包括 Bot、Doraemon、Assistant、Comparison。
其中,Bot 的应用案包括招商数字名片、SOP助手,应用技术实践为混合检索(HybridSearch); Doraemon 的应用案例包括销售/导购助手、装修设计师助理,应用技术实践为语义分块/父窗口; Assistant 应用案例包括研报助手; Comparison应用案例包括合同审批助手. Assistant/Comparison的应用技术实践包括 PDF表格解析。
最后,肖玉民分享了对于 RAG 的三大感悟:
- 其一,RAG 是一套综合技术方案,解决大模型幻觉需要持续迭代;
- 其二,企业用户需要的是开箱即用& 90 分的产品,而非只有 60 分的 demo;
- 其三,数据质量越高,回答效果越好。