最新AI资讯话题 - 冷月清谈

话题	回复	浏览量	活动
关于“AI资讯”类别	0	50	2024 年3 月 22 日
CATCH：一种基于频段通道感知的多变量时间序列异常检测框架	6	2	2025 年3 月 8 日
DeepSeek大模型赋能政务系统：效率提升与挑战并存	4	0	2025 年3 月 8 日
Manus AI Agent测评：功能与不足，以及开源复刻版的出现	3	1	2025 年3 月 8 日
免费本地部署 DeepSeek-R1 教程：告别服务器繁忙	8	0	2025 年3 月 8 日
北大开源细粒度多模态大模型Finedefics，显著提升视觉识别能力	8	1	2025 年3 月 8 日
长推理模型也存在“思考不足”问题？DeepSeek-R1等研究揭示其推理缺陷	8	0	2025 年3 月 8 日
ICLR 2025：语境对齐——让大模型更懂时间序列，性能提升开销更低	8	0	2025 年3 月 8 日
DeepSeekMoE：高效的大规模语言模型新架构	9	0	2025 年3 月 8 日
RISC-V 正式进军 AI 领域：开源指令集架构如何助力 AI 发展	7	0	2025 年3 月 8 日
X-Dyna：让照片中的人物和背景都动起来！	7	0	2025 年3 月 8 日
上海AI Lab推出Mixture-of-Memories(MoM)：赋予线性注意力稀疏记忆能力	3	0	2025 年3 月 8 日
DeepSeek官方发布R1模型推荐设置，提升使用效果	8	0	2025 年3 月 8 日
SGLang：开源推理引擎如何驱动DeepSeek模型推理革命	1	0	2025 年3 月 8 日
Deepseek V3/R1 核心技术与 RAG 前沿进展	4	0	2025 年3 月 8 日
OpenAI开源百万美元编码基准SWE-Lancer，评估大模型编程能力	8	0	2025 年3 月 8 日
利用推理能力绕过LLM安全机制：新型越狱攻击框架RACE	6	0	2025 年3 月 8 日
大型语言模型的“遗忘”可能是错觉？新研究揭示“虚假遗忘”现象	5	1	2025 年3 月 8 日
视觉强化微调Visual-RFT开源：少量数据提升多模态大模型性能	6	0	2025 年3 月 8 日
Mistral 发布高性能 OCR API，实测表现优异但仍有提升空间	4	0	2025 年3 月 8 日
昆仑万维发布Matrix-Zero世界模型，以空间智能技术突破2D限制	7	0	2025 年3 月 8 日
精准定位过拟合特征：ParShap方法解析	9	0	2025 年3 月 8 日
ToST：基于统计学的线性注意力机制，革新Transformer效率	7	0	2025 年3 月 8 日
DeepSeek 之后，大模型应用如何迈向新阶段？聚焦 AICon 大会	1	0	2025 年3 月 8 日
DeepSeek大模型高效训练：极限AI工程优化解析	6	0	2025 年3 月 8 日
DataMan：浙大&千问团队提出预训练数据管理器，显著提升大语言模型性能	7	0	2025 年3 月 8 日
DynamicCity：让AI生成的城市“动”起来！突破4D大场景生成技术边界	9	0	2025 年3 月 8 日
加入数据派，与大数据同行：志愿者招募	3	0	2025 年3 月 8 日
宽德投资成立智能学习实验室，布局通用人工智能	8	0	2025 年3 月 8 日
数据派志愿者招募：与一群志同道合的小伙伴，共建数据科学社区！	5	0	2025 年3 月 8 日