分享
(图片)对标Trickle的Prompt组合解决方案了解一下吗?Trickle-On-WeChat!
输入“/”快速插入内容
(图片)
对标Trickle的Prompt组合解决方案了解一下吗?Trickle-On-WeChat!
飞书用户1986
飞书用户7250
2024年5月28日修改
📌
原创:抄就完了
原文:
https://mp.weixin.qq.com/s/Q9ubSQHhEgpn2Yf6ndoi5w
导读
前几天看到了一款叫做“Trickle”的工具,它主要是解决了碎片化信息场景下图片整理与快速检索的难题。
看到这个产品当时,我拍案叫绝,我认为这是Prompt提示词在实际应用场景下一个很巧妙的切入点。当即我便手搓代码,复刻了一个基于微信场景且功能还原度较高的MVP(最小可行产品)应用。
下面我将会围绕产品功能实现的角度去分享一下自己的实现思路,整个方案是通过Prompt + LLM + OCR + Insight + Web Server的能力,欢迎大家共同探讨。
👀 在本文末,我分享了可以在线体验的二维码。同时我也将自己的MVP项目开源在Github上,欢迎 STAR ⭐。
Trickle简介
Trickle是由 GPT 4 驱动的截图管理工具,可以将你的截图转化为视觉备忘录,不仅能识别你截图里面的内容,还能帮你提取然后整理。
同时,Trickle支持各种截图、图片类型的识别,无论是图表、财报、网页UX原型、邮件截图等都能轻松应对。最重要的是,你还可以根据图片中提取的内容直接进行对话。
(具体功能请看视频演示介绍 👇 )
银海inhai
,赞 12
功能说明
看完视频后,感觉这款产品特别有意思。当即便到官网(
https://www.trickle.so/
)去看具体的介绍和相关参数信息,在主页中我也找到了这个产品的价值说明:
其中令我困惑不解的是:“从屏幕截图中提取见解”、“识别并突出图表中的重要信息”这两条与“识别风景或狗的照片等”、“使用传统OCR提取纯文本”似乎有点矛盾?
我理解的是:它是不是想要强调Trickle这个产品虽然是也有用了OCR(光学字符识别),但是要比OCR能力强?并且不具备图像识别的能力?
正当我困惑不解,准备点击“Get Started Free”按钮进行深度体验的时候,好家伙!又进入了一个套路。