爱诗科技(AIsphere)公司研究
研究日期:2026年5月16日 | 非上市公司,拟赴港IPO
一、公司概览
| 维度 | 详情 |
|---|---|
| **公司全称** | 北京爱诗科技有限公司 |
| **英文名** | AIsphere |
| **成立时间** | 2023年4月 |
| **总部** | 北京 |
| **创始人/CEO** | 王长虎 |
| **联合创始人** | 谢旭璋 |
| **定位** | 全球领先的AI视频生成大模型及应用公司 |
| **核心产品** | PixVerse(海外版)/ 拍我AI(国内版) |
| **全球用户** | 突破1亿 |
| **月活跃用户** | 超1600万 |
| **最新估值** | 超10亿美元(独角兽) |
| **ARR** | 超4000万美元(2025年10月) |
| **IPO计划** | 拟2026年赴港上市,中金+摩根大通担任投行 |
二、创始背景
王长虎(创始人兼CEO)
– **出生**:1982年,辽宁本溪
– **学历**:中国科学技术大学博士(计算机视觉方向)
– **职业经历**:
– **微软亚洲研究院(2009-2017)**:任职8年,从事计算机视觉研究
– **字节跳动(2017-2022)**:AI Lab总监/视觉技术负责人,主导抖音和TikTok从0到1的视频AI能力建设,搭建字节跳动视觉算法平台和业务中台
– **创业契机**:2023年大模型技术爆发,王长虎凭借20年计算机视觉与AI经验,判断AI视频生成是确定性方向,从字节离职创办爱诗科技
– **关键故事**:创业初期曾遭天使投资人朱啸虎”劝退”,但两年后Sora发布验证了赛道,爱诗科技凭借先发优势成为国内AI视频头部企业
谢旭璋(联合创始人)
– **年龄**:90后
– **角色**:负责产品与运营
– **公开观点**:认为AI在视频内容中占比极小,全球AI创作视频总量仅几亿量级,而全世界一天视频消费量达数十亿,市场空间巨大
团队特征
– 核心团队多来自顶级视觉算法研发背景(微软亚洲研究院、字节跳动AI Lab等)
– 创始人”技术+产品”双基因:王长虎技术出身但深度参与抖音产品化,谢旭璋产品运营导向
– 两人搭配被称为”不会创业的创始人”,但凭借技术硬实力跑到了行业头部
三、核心产品发展历程
PixVerse(海外版)
爱诗科技核心产品,定位为全球AI视频生成平台。采用Diffusion与Transformer融合的自研DiT架构,是国内首个发布DiT架构的视频生成创业公司。
**版本迭代时间线**:
| 版本 | 时间 | 核心能力 |
|---|---|---|
| **V1** | 2023年11月 | 首版上线,文生视频基础能力 |
| **V2** | 2024年中 | 模型能力提升,视频质量改善 |
| **V3** | 2024年10月 | 底层模型大幅提升,新增创意模板(Effect)、口型匹配功能,API开放 |
| **V4** | 2025年2月 | 底模全面升级,5秒出片(全球最快),支持智能生成视频音效、一键匹配人声台词、多种视频风格实时重绘 |
| **V4.5** | 2025年5月 | APP热度赶超TikTok,跻身美国总榜第四;”毒液变身”等爆款特效在TikTok播放量数十亿次 |
| **V5** | 2025年8月 | 自研视频生成大模型,上线Agent创作助手;Artificial Analysis测评图生视频全球第一、文生视频第二 |
| **V5.5** | 2025年12月 | 国内首款支持”多镜头+音画同步一键直出”的AI视频大模型,从”单镜头生成”迈向”完整叙事” |
| **R1** | 2026年初 | 全球首个通用实时世界模型,用户指令可实时改变视频走向,实现”无限流、多模态、实时响应”的代际跨越 |
拍我AI(国内版)
– **上线时间**:2025年6月6日
– **定位**:PixVerse国内版,面向中国用户的AI视频创作工具
– **特色**:零门槛体验爆款特效,同步上线网页端及移动端
– **版本**:与PixVerse同步迭代(V4.5→V5→V5.5)
开放平台(API)
– **上线时间**:2025年3月
– **合作伙伴**:超100家
– **累计调用量**:超千万次视频生成(截至2025年8月)
– **8月环比增长**:超100%
– **应用场景**:影视、广告、电商、教育等
四、发展时间线
| 时间 | 里程碑 |
|---|---|
| 2023年4月 | 公司成立,定位AI视频生成 |
| 2023年8月 | 完成天使轮融资(数千万人民币) |
| 2023年11月 | 首个产品PixVerse上线 |
| 2024年1月 | PixVerse海外版正式发布 |
| 2024年4月 | 完成蚂蚁集团领投A轮融资 |
| 2024年10月 | PixVerse V3上线,开放API |
| 2024年11月 | 正式启动商业化 |
| 2025年2月 | PixVerse V4上线,5秒出片全球最快 |
| 2025年3月 | A5轮融资(靖亚资本),开放平台API上线 |
| 2025年5月 | V4.5上线,MAU达1619万,全球AI视频应用第一 |
| 2025年6月 | 国内版”拍我AI”正式上线 |
| 2025年7月 | 入选联合国AI向善全球峰会案例 |
| 2025年8月 | PixVerse V5发布,图生视频全球排名第一 |
| 2025年9月 | B轮融资6000万美元,阿里巴巴领投 |
| 2025年10月 | B+轮融资1亿人民币,ARR突破4000万美元,全球用户破1亿 |
| 2025年12月 | V5.5上线,支持多镜头+音画同步 |
| 2026年3月 | C轮融资3亿美元,鼎晖投资领投,估值超10亿美元 |
| 2026年初 | 发布全球首个实时世界模型PixVerse R1 |
| 2026年4月 | 传出拟赴港IPO消息,中金+摩根大通担任投行 |
五、产品矩阵
| 产品 | 类型 | 目标用户 | 核心功能 | 上线时间 |
|---|---|---|---|---|
| **PixVerse** | C端应用(海外) | 全球创作者/普通用户 | 文生视频、图生视频、特效模板、Agent助手 | 2024年1月 |
| **拍我AI** | C端应用(国内) | 中国创作者/普通用户 | 同PixVerse功能,本地化适配 | 2025年6月 |
| **开放平台** | B端API | 企业/开发者 | 视频生成API接入,技术授权 | 2025年3月 |
| **PixVerse R1** | 前沿产品 | 探索型用户 | 实时世界模型,指令改变视频走向 | 2026年初 |
商业模式
– **C端订阅**:Freemium模式,免费基础功能+付费高级功能
– **B端API**:按调用次数/生成时长计费
– **商业化起点**:2024年11月
– **收入增长**:不到一年收入增长超10倍
六、财务状况
⚠️ 爱诗科技为非上市公司,财务数据有限,以下为公开渠道可获取信息。
融资历史
| 轮次 | 时间 | 金额 | 领投方 | 跟投方 |
|---|---|---|---|---|
| 天使轮 | 2023年8月 | 数千万人民币 | — | — |
| A轮 | 2024年4月 | 未披露 | 蚂蚁集团 | — |
| A1-A5轮 | 2024-2025年 | 累计超4亿人民币 | 达晨财智等 | 蚂蚁集团等 |
| A5轮 | 2025年3月 | 未披露 | 靖亚资本(独家) | — |
| B轮 | 2025年9月 | 6000万美元 | 阿里巴巴 | 达晨财智、深创投、北京市AI基金、湖南电广、巨人网络、Antler |
| B+轮 | 2025年10月 | 1亿人民币 | — | 复星锐正、同创伟业、顺禧基金 |
| C轮 | 2026年3月 | 3亿美元 | 鼎晖投资(鼎晖香港/VGC/百孚) | 中国儒意、三七互娱、亦庄国投、众为资本、国泰君安创新投资、苏创投、华控基金、复星锐正等20+机构 |
**累计融资总额**:约4亿美元+
关键财务指标
| 指标 | 数据 | 时间 |
|---|---|---|
| **ARR** | 超4000万美元 | 2025年10月 |
| **收入增速** | 不到一年增长超10倍 | 2024.11-2025.10 |
| **估值** | 60-80亿人民币(约10亿美元) | 2026年3月(C轮后) |
| **商业化起点** | 2024年11月 | — |
估值对比
| 公司 | 估值 | ARR | 估值/ARR |
|---|---|---|---|
| **爱诗科技** | ~10亿美元 | ~4000万美元 | ~25x |
| **Runway** | 53亿美元 | 2-5亿美元 | 10-26x |
| **可灵AI** | — | 2.4亿美元(年化) | — |
| **生数科技** | 20亿美元+ | — | — |
七、竞争格局
国内竞争
| 竞争对手 | 背后公司 | 核心产品 | 竞争优势 | 与爱诗科技差距 |
|---|---|---|---|---|
| **可灵AI** | 快手 | 可灵AI | 月收入2000万美元,年化收入2.4亿美元,”模型+剪辑+分发”闭环 | ⚠️ 收入体量约6倍 |
| **Seedance** | 字节跳动 | Seedance 2.0 | 流量+生态+定价锚定每秒1元 | ⚠️ 字节系资源碾压 |
| **生数科技** | 独立 | Vidu | 同获阿里投资,估值20亿美元+ | ⚠️ 估值2倍,同样拟上市 |
| **即梦AI** | 字节跳动 | 即梦 | 字节系,流量+技术 | — |
全球竞争
| 竞争对手 | 总部 | 估值 | 核心优势 |
|---|---|---|---|
| **Runway** | 美国 | 53亿美元 | 先发优势,好莱坞生态,Gen-3 Alpha |
| **Pika** | 美国 | 4.7亿美元+ | 同为2023年4月成立,特效功能突出 |
| **Sora** | OpenAI | — | 已关停(每天亏损100万美元) |
| **Google Veo** | 美国 | — | Gemini生态加持 |
竞争定位
– ✅ **PixVerse全球AI视频应用用户量第一**(MAU 1619万)
– ✅ **V5图生视频全球排名第一**(Artificial Analysis测评)
– ⚠️ **收入规模与头部差距明显**(可灵AI年化2.4亿美元 vs 爱诗4000万美元)
– ⚠️ **估值全球视角偏保守**(Runway 53亿 vs 爱诗10亿)
八、工作机会
招聘概况
– **在招岗位**:65+个(BOSS直聘数据,2026年5月)
– **招聘需求增长**:2025年同比增长93%(职友集数据)
– **核心招聘方向**:AI视频生成算法、大模型训练/推理系统、产品、设计
– **办公地点**:北京(总部,海淀区苏州街3号)、上海(分部)
– **公司规模**:C轮独角兽,团队快速扩张中(2023年社保人数10人→当前估计150-300人)
热门岗位
| 岗位 | 方向 | 核心要求 | 估算年薪(万元) |
|---|---|---|---|
| 视觉生成算法工程师 | 视频生成核心 | Diffusion/Transformer/DiT,PyTorch,CV方向PhD优先 | 60-150+ |
| 大模型算法工程师 | 模型训练 | 预训练/RLHF/推理优化,大模型实战经验 | 60-150+ |
| 大模型系统工程师 | 训练/推理系统 | 分布式训练,GPU集群,CUDA,高并发系统 | 50-120 |
| 强化学习工程师 | RL方向 | RLHF/RLAIF,视频生成对齐 | 50-120 |
| AI基础设施负责人 | 基础架构 | ML平台,容器化,大规模集群运维 | 80-150+ |
| 前端开发工程师 | 产品前端 | React/Vue,音视频处理经验优先 | 30-60 |
| AI产品经理 | 产品方向 | AI产品0-1经验,视频/创作类优先 | 40-80 |
| 设计师 | 视觉/交互 | AI创作工具设计经验,视频类加分 | 30-60 |
| 运维开发工程师 | DevOps | K8s/容器,GPU集群管理 | 40-80 |
校招岗位(2026届)
| 岗位 | 学历要求 | 核心要求 |
|---|---|---|
| 算法工程师(校招) | 本科及以上,计算机/软件工程优先 | Python,PyTorch/TensorFlow,CV基础(ResNet/ViT/VAE/GAN/Diffusion),概率统计/数值优化 |
| 大模型系统工程师(校招) | 本科及以上 | 大模型训练/推理系统,分布式系统,性能优化,高并发高可靠 |
| 前端开发工程师(校招) | 本科及以上 | React/Vue,音视频处理 |
| 算法实习生 | 在读硕士/博士 | 视觉生成/大模型方向研究 |
工作环境
– **总部办公**:北京海淀区苏州街(中关村核心区域)
– **上海分部**:有上海岗位在招(猎聘数据)
– **技术氛围**:创始人王长虎微软亚研院+字节AI Lab出身,团队技术基因极强
– **迭代节奏**:2年8个大版本,技术迭代极快,适合追求技术成长的人
– **国际化**:产品面向全球1亿用户,英文工作环境常见
– **行业地位**:全球AI视频生成应用用户量第一,Artificial Analysis图生视频全球第一
人才需求特点
– **极度偏好CV/视频方向**:王长虎20年CV背景决定公司技术底色,视频生成经验者最有竞争力
– **字节系基因**:创始人+核心团队字节背景,字节系履历是加分项
– **学术要求高**:算法岗偏好PhD,校招也要求扎实的数学和算法基础
– **实战优先**:有大模型训练/推理实战经验比纯学术背景更有优势
– **期权吸引力**:C轮独角兽+拟赴港IPO,早期员工期权潜在回报可观
九、待遇与福利
薪酬结构
– **构成**:Base + 绩效奖金 + 期权(核心岗位标配)
– **发薪方式**:月薪制
– **调薪机制**:创业公司灵活性较高,年度review
– **期权**:C轮独角兽,拟2026年赴港IPO,期权为重要薪酬组成部分
薪资水平
数据来源:职友集、BOSS直聘、行业对标推算。爱诗科技为非上市公司,薪资信息非官方披露。
| 层级 | 年薪范围(万元) | 说明 |
|---|---|---|
| 实习生 | 0.3-0.8万/月 | 算法/大模型方向实习生 |
| 应届生(校招) | 40-70 | 算法岗上限更高,985/PhD可谈 |
| 1-3年经验 | 40-80 | 视频生成/大模型实战经验者溢价 |
| 3-5年经验 | 60-120 | 核心算法岗可达上限+期权 |
| 5-10年经验 | 80-180 | 专家/负责人级,含期权可达200万+ |
| 高级/首席科学家 | 150-300+ | 含期权,对标月之暗面/DeepSeek水平 |
**职友集参考数据**:
– 薪酬区间:8K-50K/月(年薪约9.6万-60万)
– 85.7%的岗位月薪20K-50K(年薪约24万-60万)
– 计算机/技术类岗位占比85.7%
**行业对标参考**:
– 爱诗科技定位AI视频生成,算法岗薪资对标月之暗面(80-200万)、智谱(60-120万)
– 作为C轮独角兽,现金部分可能略低于月之暗面/DeepSeek,但期权潜在回报更高
– 若2026年成功IPO,早期员工期权价值将显著提升
福利体系
| 福利项 | 说明 |
|---|---|
| 五险一金 | 北京标准缴纳 |
| 补充医疗 | 创业公司标配(需入职确认) |
| 期权激励 | 核心岗位标配,C轮独角兽期权价值潜力大 |
| 弹性工作 | 创业公司节奏,但AI行业普遍6天/晚10点 |
| 餐补/零食 | 北京办公标配 |
| 年度体检 | 标配 |
特色福利
– **IPO红利窗口**:拟2026年赴港上市,当前入职仍属”pre-IPO”阶段,期权兑现窗口明确
– **技术成长极快**:2年8个大版本迭代,全球AI视频生成第一,技术成长速度远超大厂
– **全球化视野**:产品服务全球1亿用户,TikTok/美国总榜前四,天然国际化工作环境
– **扁平组织**:创业公司架构,与王长虎等顶级技术专家直接协作
– **赛道确定性**:AI视频生成是2025-2026最热赛道之一,职业跳板价值高
⚠️ 注意事项
– **工作强度**:AI创业公司普遍高强度,参考同行6天/周、晚10点下班属常态
– **现金流风险**:4000万美元ARR尚未盈利,创业公司稳定性低于大厂
– **期权流动性**:IPO前期权无法变现,上市后亦有锁定期
– **竞争激烈**:快手/字节等巨头挤压,公司长期竞争格局存在不确定性
数据截止:2026年5月 | 数据来源:36氪、百度百科、搜狐、新浪财经、观察者网、职友集、BOSS直聘、猎聘、牛客网