Discover how Ace Lee’s CapWords uses AI, VisionKit, and Apple frameworks to transform everyday photos into language-learning stickers.
͏
⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏
走进“CapWords”打动人心的妙趣设计
对于一款灵感源自 3 岁孩子的 App 来说,“CapWords”无疑利用了大量前沿技术。
严格来说,“CapWords”是由 Ace Lee 开发的,他也是中国本土企业 HappyPlan Tech 的创始人,公司更是凭借这款 App 荣获 2025 年 Apple 设计大奖“乐趣横生”奖项。但这款 App 的理念“利用 AI 拍照识词,通过动画贴纸趣学语言”,却源自一位更年轻的“合伙人”。
“灵感来自我和女儿的日常互动。”Ace 回忆道,“每天从幼儿园回家的路上,她总会指着身边的东西问我‘这个用英语怎么说?’。有一天,她指着一个路牌问‘这个怎么说?’。我被问住了,一下子答不上来,赶紧打开翻译软件,然后一个生硬的机械音蹦了出来:‘Signpost’。女儿只是轻轻地说了一句‘噢’。我能感觉到,少了点什么。”
少的是什么呢?情感联结。小朋友通常不喜欢这种冰冷的机械音。Ace 意识到,放学路上,真正吸引女儿的从来不是答案本身,而是他们之间自然而有温度的情感联结。
兼容平台:iPhone、iPad
团队规模:3 人
公司总部:北京
荣获奖项:Apple 设计大奖 (2025 年)、App Store 大奖 (2025 年)
正因如此,“CapWords”始终把惊喜感和探索欲放在首位。咖啡杯、交通锥、纸杯蛋糕、路牌等等,只要对准物品拍张照,这款 App 就会利用 AI 将照片变成贴纸,同时告诉你物品的名称和发音。生成的贴纸会直接收藏在 App 中。点图片、看动画、听反馈,这种主动参与可以强化记忆,让 3 岁及以上用户学得更轻松。“‘CapWords’扎根于现实世界的感官体验:声音、触觉和视觉线索,”Ace 的好友、同时也协助了该 App 开发的 Clu Soh 说道,“这正是它出色体验的秘诀。”
事实上,贴纸这一核心设计也起源于 Ace 的女儿。“从 2 岁起,她就喜欢把贴纸到处贴,冰箱上、沙发上,甚至我的脸上。”Ace 笑着说,“那股认真劲儿,就像在搞艺术创作。这让我想到:能不能把现实世界里的东西‘撕下来’收藏?”
这种“撕下来”的物品提取过程,是团队遇到的第一个技术难题。“我们一开始试过许多能在设备端运行的模型,希望从照片中抠出物品,但每个模型都有这样或那样的问题。”Clu 说,“要么必须预先下载图像,要么得在用户启动 App 时下载模型,既耗时又占空间。而且,有些物品的边缘不清晰,根本切不干净。”
“CapWords”创始人 Ace Lee 正在研究现实中的贴纸,这些贴纸构成了他 App 语言学习理念的基石。
幸运的是,团队在 VisionKit 中找到了简洁高效的解法。“它效果特别好,还不用在 App 中集成大模型,”Clu 说,“就这样,我们轻松实现了‘撕’下物品。”
下一步是识别贴纸中的物品,团队把这个任务交给了刚发布的 ChatGPT-4。“那时候,我们连 App 都还没做,”Clu 回忆说,“但我们不断把 VisionKit 抠出来的各种物品喂给 ChatGPT,问它‘这是什么?请用中文、法语、西班牙语……告诉我’。我们几乎把想学的语言都问遍了。”
基础功能就绪后,团队开始充分利用更多 Apple 框架。“我们用 AVAudioEngine 播放音频,用 Neural Voice 让声音更自然。iOS API 的空间识别对抽认卡功能帮助很大。当然,还有 CloudKit,确保用户数据在 iPhone 和 iPad 间保持同步。”
更重要的是,“CapWords”不会存储任何用户生成的图像,照片会传输到 AI 模型进行一次性识别,随后即被删除。图像不会保存在本地,任何内容都不会上传到服务器 (因为“CapWords”压根儿没有服务器)。
对准日常物品 (比如杯子) 拍张照,“CapWords”就能利用 AI 将照片变成贴纸,并分享物品的名称和发音。
“CapWords”斩获了 Apple 设计大奖的“乐趣横生”奖项,这对教育类 App 而言绝非易事,很大程度上归功于照片变贴纸的神奇瞬间。
“拍下照片后,App 会进行处理,你需要确认这是否是你想要收集的物品。确认这一步其实给系统争取了时间,让它能从 API 获取结果。”Clu 解释道,“在后台,我们将流程拆分为几个阶段:拍摄 → 去背景 → 确认 → 显示结果。”
但 Clu 表示,大多数用户根本注意不到,因为 App 会播放一段“微动画”,让用户沉浸其中,同时后台流程会悄然完成。
令人惊叹的是,从最初关于路牌的父女对话,到 App 正式上线,整个过程只用了短短四个月。技术上,这款 App 已经足够亮眼,但真正让它闪光的,是对惊喜和好奇的用心呵护:它真的在从孩子的视角看世界。Clu 甚至收到了最高评价:一位朋友说,他女儿不再玩“Pokémon Go”,而是爱上了“CapWords”。“这完全出乎我们的意料,”他笑着说,“但这也让我们明白,‘CapWords’不只是给孩子或大人用的工具,而是全家可以一起玩的 App。家长和孩子能一起探索身边的世界,拍照收集单词、复习词汇,把语言学习变成一段亲子共享的美好时光。”
“看到我们的 App 帮人们重新发现语言学习的乐趣,真是一种莫大的荣幸。”“CapWords”创始人、荞麦面爱好者 Ace Lee 表示。
从上线第一天起,“CapWords”就在联结家庭,让一家人共学共玩。“有用户告诉我们,感觉自己就像一个初到地球的外星人,想要给每样东西命名,收集起来。还有用户表示‘CapWords’是‘我用过最温暖、最人性化的 AI'。”Ace 说道,“看到我们的 App 帮人们重新发现语言学习的乐趣,不是通过课本,而是通过日常生活,真是一种莫大的荣幸。”
 |
|
开发者故事
|
走进“CapWords”打动人心的妙趣设计
|
|
对于一款灵感源自 3 岁孩子的 App 来说,“CapWords”无疑利用了大量前沿技术。
|
|
严格来说,“CapWords”是由 Ace Lee 开发的,他也是中国本土企业 HappyPlan Tech 的创始人,公司更是凭借这款 App 荣获 2025 年 Apple 设计大奖“乐趣横生”奖项。但这款 App 的理念“利用 AI 拍照识词,通过动画贴纸趣学语言”,却源自一位更年轻的“合伙人”。
|
|
“灵感来自我和女儿的日常互动。”Ace 回忆道,“每天从幼儿园回家的路上,她总会指着身边的东西问我‘这个用英语怎么说?’。有一天,她指着一个路牌问‘这个怎么说?’。我被问住了,一下子答不上来,赶紧打开翻译软件,然后一个生硬的机械音蹦了出来:‘Signpost’。女儿只是轻轻地说了一句‘噢’。我能感觉到,少了点什么。”
|
|
少的是什么呢?情感联结。小朋友通常不喜欢这种冰冷的机械音。Ace 意识到,放学路上,真正吸引女儿的从来不是答案本身,而是他们之间自然而有温度的情感联结。
|
|
|
CapWords
|
|
兼容平台:iPhone、iPad
团队规模:3 人
公司总部:北京
荣获奖项:Apple 设计大奖 (2025 年)、App Store 大奖 (2025 年)
|
|
下载
|
|
|
|
正因如此,“CapWords”始终把惊喜感和探索欲放在首位。咖啡杯、交通锥、纸杯蛋糕、路牌等等,只要对准物品拍张照,这款 App 就会利用 AI 将照片变成贴纸,同时告诉你物品的名称和发音。生成的贴纸会直接收藏在 App 中。点图片、看动画、听反馈,这种主动参与可以强化记忆,让 3 岁及以上用户学得更轻松。“‘CapWords’扎根于现实世界的感官体验:声音、触觉和视觉线索,”Ace 的好友、同时也协助了该 App 开发的 Clu Soh 说道,“这正是它出色体验的秘诀。”
|
|
事实上,贴纸这一核心设计也起源于 Ace 的女儿。“从 2 岁起,她就喜欢把贴纸到处贴,冰箱上、沙发上,甚至我的脸上。”Ace 笑着说,“那股认真劲儿,就像在搞艺术创作。这让我想到:能不能把现实世界里的东西‘撕下来’收藏?”
|
|
“这是什么?请告诉我。”
|
|
这种“撕下来”的物品提取过程,是团队遇到的第一个技术难题。“我们一开始试过许多能在设备端运行的模型,希望从照片中抠出物品,但每个模型都有这样或那样的问题。”Clu 说,“要么必须预先下载图像,要么得在用户启动 App 时下载模型,既耗时又占空间。而且,有些物品的边缘不清晰,根本切不干净。”
|
 |
|
“CapWords”创始人 Ace Lee 正在研究现实中的贴纸,这些贴纸构成了他 App 语言学习理念的基石。
|
|
幸运的是,团队在 VisionKit 中找到了简洁高效的解法。“它效果特别好,还不用在 App 中集成大模型,”Clu 说,“就这样,我们轻松实现了‘撕’下物品。”
|
|
下一步是识别贴纸中的物品,团队把这个任务交给了刚发布的 ChatGPT-4。“那时候,我们连 App 都还没做,”Clu 回忆说,“但我们不断把 VisionKit 抠出来的各种物品喂给 ChatGPT,问它‘这是什么?请用中文、法语、西班牙语……告诉我’。我们几乎把想学的语言都问遍了。”
|
|
|
“‘CapWords’扎根于真实世界的感官体验:声音、触觉和视觉线索,这正是它出色体验的秘诀。”
|
|
Clu Soh, CapWords
|
|
|
|
基础功能就绪后,团队开始充分利用更多 Apple 框架。“我们用 AVAudioEngine 播放音频,用 Neural Voice 让声音更自然。iOS API 的空间识别对抽认卡功能帮助很大。当然,还有 CloudKit,确保用户数据在 iPhone 和 iPad 间保持同步。”
|
|
更重要的是,“CapWords”不会存储任何用户生成的图像,照片会传输到 AI 模型进行一次性识别,随后即被删除。图像不会保存在本地,任何内容都不会上传到服务器 (因为“CapWords”压根儿没有服务器)。
|
|
贴纸魔法的完美落地
|
 |
|
对准日常物品 (比如杯子) 拍张照,“CapWords”就能利用 AI 将照片变成贴纸,并分享物品的名称和发音。
|
|
“CapWords”斩获了 Apple 设计大奖的“乐趣横生”奖项,这对教育类 App 而言绝非易事,很大程度上归功于照片变贴纸的神奇瞬间。
|
|
“拍下照片后,App 会进行处理,你需要确认这是否是你想要收集的物品。确认这一步其实给系统争取了时间,让它能从 API 获取结果。”Clu 解释道,“在后台,我们将流程拆分为几个阶段:拍摄 → 去背景 → 确认 → 显示结果。”
|
|
但 Clu 表示,大多数用户根本注意不到,因为 App 会播放一段“微动画”,让用户沉浸其中,同时后台流程会悄然完成。
|
|
令人惊叹的是,从最初关于路牌的父女对话,到 App 正式上线,整个过程只用了短短四个月。技术上,这款 App 已经足够亮眼,但真正让它闪光的,是对惊喜和好奇的用心呵护:它真的在从孩子的视角看世界。Clu 甚至收到了最高评价:一位朋友说,他女儿不再玩“Pokémon Go”,而是爱上了“CapWords”。“这完全出乎我们的意料,”他笑着说,“但这也让我们明白,‘CapWords’不只是给孩子或大人用的工具,而是全家可以一起玩的 App。家长和孩子能一起探索身边的世界,拍照收集单词、复习词汇,把语言学习变成一段亲子共享的美好时光。”
|
 |
|
“看到我们的 App 帮人们重新发现语言学习的乐趣,真是一种莫大的荣幸。”“CapWords”创始人、荞麦面爱好者 Ace Lee 表示。
|
|
从上线第一天起,“CapWords”就在联结家庭,让一家人共学共玩。“有用户告诉我们,感觉自己就像一个初到地球的外星人,想要给每样东西命名,收集起来。还有用户表示‘CapWords’是‘我用过最温暖、最人性化的 AI'。”Ace 说道,“看到我们的 App 帮人们重新发现语言学习的乐趣,不是通过课本,而是通过日常生活,真是一种莫大的荣幸。”
|
|
|
|
最初发布于 2025 年 12 月 4 日
|
|
|
|
|
|
|