从 ChatGPT 到开源工具
2022 年,我初次接触 ChatGPT 3.5 网页端时,倍感惊艳。在那之后,我主要使用通义千问的网页版,虽然其表现中规中矩,但足以应对日常工作。直到今年年初,我开始深度使用 DeepSeek 的客户端,其多端同步功能带来了不小的便利。而随着 Gemini 2.0 Pro 的发布,我则完全转向了通过 API 调用并搭配开源桌面客户端的使用方式。 与 DeepSeek 深度对话
在年初使用 DeepSeek 期间,我探索出一种与 AI 进行深度对话的模式,用以探讨悬而未决的人生与情感话题。最打动我的一点是,其客户端提供了一个明确的隐私开关,承诺开启后平台将不会使用用户的聊天历史——我选择了信任它。让我印象深刻的是,我们之间最长的一段对话持续了超过 200 轮,累计字数逾 50 万,而整个过程十分流畅。 没有好用的 AI 工具
到了年中,我开始尝试可接入 Gemini API 的各类开源应用(如 Cherry Studio)。Gemini 2.0 Pro 的细腻和善于隐喻的表达方式是如此出色,以至于我宁愿为 API 付费,也不愿再回到 DeepSeek。然而,这些开源应用普遍存在设计简陋、隐私保护不足等缺陷,严重影响了我的深度聊天体验。这促使我写下了一篇博客——《AI 聊天应用的十条高级需求》。 尝试 Vibe Coding 开发方式
恰逢此时,得益于 Claude 3.7 Sonnet 加持的 Cursor 出现在我的视野里,我立即着手实践“Vibe Coding”——在两天内就基本实现了自己提出的十个需求。顺其自然地,我参考 Cursor 的命名,将这个新应用命名为 Pointer。 20 个功能点
如今,Pointer 已初具雏形,并成为我日常使用 LLM 的主要工具。在不断打磨的过程中,我将 Pointer 的核心功能点梳理并扩展为 20 个。这些功能点与之前博客中的设想或有重叠,但经过实践,我对每一个细节都有了更深的感悟。下面我将它们逐一记录分享。
文件夹
标签页
消息折叠
消息分支
消息导航
消息等待队列
动态切换模型
右键引用
右键新建对话
对话截图
复制表格
全局检索
会话检索
星标 or 置顶
收藏 or 笔记
导入导出
导入外部聊天记录
对 MCP 说不
对多模态说不
对联网搜索说不
1. 文件夹
当前主流 AI 聊天应用的会话列表,大多是按时间排序的线性结构,最新会话置于顶部。在设计 Pointer 时,我主要参考了 VS Code 的文件资源管理器,最终选择了树形文件夹的分类方式。这种结构的好处显而易见:你可以按不同主题划分会话,或在后续专门花时间整理归纳,这是一件非常 chill 惬意的事情。
核心操作:文件夹应支持一键清空、删除、导出等批量操作。
待办:多选操作是必要的,但这个功能对于 AI 辅助编程来说实现起来有些挑战,Pointer 暂未支持。