CoCoMix:Meta提出新型Transformer预训练框架,性能优于知识蒸馏
|
|
1
|
0
|
2025 年3 月 13 日
|
DeepSeek-R1 模型图解:大规模强化学习与推理能力的炼成
|
|
7
|
1
|
2025 年3 月 13 日
|
Manus:全球首款通用AI Agent,连接思想与行动
|
|
9
|
1
|
2025 年3 月 13 日
|
陈立武正式执掌英特尔:芯片创投“教父”能否带领老牌巨头重获新生?
|
|
0
|
0
|
2025 年3 月 13 日
|
AppAgentX:让手机智能体自主进化,兼顾智能与效率
|
|
2
|
0
|
2025 年3 月 13 日
|
李飞飞团队推出BEHAVIOR Robot Suite:让机器人胜任多样家庭任务
|
|
1
|
0
|
2025 年3 月 13 日
|
AI 科学家论文通过 ICLR 研讨会评审:AI 助力科研新突破
|
|
0
|
0
|
2025 年3 月 13 日
|
加入数据派,与大数据同行:志愿者招募
|
|
8
|
0
|
2025 年3 月 13 日
|
智源开源BGE-VL:基于MegaPairs合成数据的领先多模态向量模型
|
|
9
|
0
|
2025 年3 月 13 日
|
Armv9 边缘AI平台发布:赋能十亿参数端侧模型
|
|
7
|
0
|
2025 年3 月 13 日
|
LangChain父文档检索器优化:仅使用向量数据库增强上下文检索
|
|
9
|
0
|
2025 年3 月 13 日
|
ProAPO:CVPR2025论文解读,自动化提示优化提升视觉分类性能
|
|
1
|
0
|
2025 年3 月 13 日
|
前DeepMind科学家创业Reflection AI,豪掷1.3亿美元逐梦超级智能
|
|
7
|
0
|
2025 年3 月 13 日
|
LightTransfer:高效迁移 Transformer 模型,推理阶段 KV 缓存缩减一半
|
|
1
|
0
|
2025 年3 月 13 日
|
AI 驱动编程:氛围编码兴起,创业公司代码由 AI 生成
|
|
8
|
0
|
2025 年3 月 13 日
|
Manus AI Agent测评:功能与不足,以及开源复刻版的出现
|
|
9
|
1
|
2025 年3 月 13 日
|
360智脑开源Light-R1:低成本实现数学推理能力新突破
|
|
9
|
0
|
2025 年3 月 13 日
|
谷歌发布Gemma 3:更少参数超越Qwen,引领单GPU模型新纪元
|
|
0
|
0
|
2025 年3 月 12 日
|
揭秘大模型智能:Transformer架构、涌现智能与DeepSeek的逆袭之路
|
|
0
|
0
|
2025 年3 月 12 日
|
SmolLM2:小模型,大能量——多阶段训练与高质量数据助力1.7B模型超越同级
|
|
0
|
0
|
2025 年3 月 12 日
|
牛津博士论文揭示:可扩展持续深度学习需考虑计算成本
|
|
0
|
0
|
2025 年3 月 12 日
|
多模态学习:融合图像与文本,提升医学图像理解新高度
|
|
0
|
0
|
2025 年3 月 12 日
|
腾讯元宝用户协议修改风波:AI 生成内容的版权归属之争
|
|
9
|
0
|
2025 年3 月 12 日
|
字节公开Seedream 2.0文生图技术细节:数据处理到RLHF全流程解析
|
|
0
|
0
|
2025 年3 月 12 日
|
何恺明团队新作:去噪哈密顿网络(DHN)实现更高级物理推理
|
|
0
|
0
|
2025 年3 月 12 日
|
数据派志愿者招募:与一群志同道合的小伙伴,共建数据科学社区!
|
|
9
|
0
|
2025 年3 月 12 日
|
OpenAI发布Responses API和开源Agents SDK,助力开发者构建智能Agent
|
|
0
|
0
|
2025 年3 月 12 日
|
从时空数据中学习因果表示:博士论文解读
|
|
9
|
0
|
2025 年3 月 12 日
|
ICLR 2025 Spotlight:多模态信息赋能3D小样本分割,无需额外标注成本
|
|
6
|
0
|
2025 年3 月 12 日
|
单卡玩转320亿参数大模型:QwQ-32B本地部署指南
|
|
8
|
1
|
2025 年3 月 12 日
|