关于“AI资讯”类别
|
|
0
|
50
|
2024 年3 月 22 日
|
CATCH:一种基于频段通道感知的多变量时间序列异常检测框架
|
|
6
|
2
|
2025 年3 月 8 日
|
DeepSeek大模型赋能政务系统:效率提升与挑战并存
|
|
4
|
0
|
2025 年3 月 8 日
|
Manus AI Agent测评:功能与不足,以及开源复刻版的出现
|
|
3
|
1
|
2025 年3 月 8 日
|
免费本地部署 DeepSeek-R1 教程:告别服务器繁忙
|
|
8
|
0
|
2025 年3 月 8 日
|
北大开源细粒度多模态大模型Finedefics,显著提升视觉识别能力
|
|
8
|
1
|
2025 年3 月 8 日
|
长推理模型也存在“思考不足”问题?DeepSeek-R1等研究揭示其推理缺陷
|
|
8
|
0
|
2025 年3 月 8 日
|
ICLR 2025:语境对齐——让大模型更懂时间序列,性能提升开销更低
|
|
8
|
0
|
2025 年3 月 8 日
|
DeepSeekMoE:高效的大规模语言模型新架构
|
|
9
|
0
|
2025 年3 月 8 日
|
RISC-V 正式进军 AI 领域:开源指令集架构如何助力 AI 发展
|
|
7
|
0
|
2025 年3 月 8 日
|
X-Dyna:让照片中的人物和背景都动起来!
|
|
7
|
0
|
2025 年3 月 8 日
|
上海AI Lab推出Mixture-of-Memories(MoM):赋予线性注意力稀疏记忆能力
|
|
3
|
0
|
2025 年3 月 8 日
|
DeepSeek官方发布R1模型推荐设置,提升使用效果
|
|
8
|
0
|
2025 年3 月 8 日
|
SGLang:开源推理引擎如何驱动DeepSeek模型推理革命
|
|
1
|
0
|
2025 年3 月 8 日
|
Deepseek V3/R1 核心技术与 RAG 前沿进展
|
|
4
|
0
|
2025 年3 月 8 日
|
OpenAI开源百万美元编码基准SWE-Lancer,评估大模型编程能力
|
|
8
|
0
|
2025 年3 月 8 日
|
利用推理能力绕过LLM安全机制:新型越狱攻击框架RACE
|
|
6
|
0
|
2025 年3 月 8 日
|
大型语言模型的“遗忘”可能是错觉?新研究揭示“虚假遗忘”现象
|
|
5
|
1
|
2025 年3 月 8 日
|
视觉强化微调Visual-RFT开源:少量数据提升多模态大模型性能
|
|
6
|
0
|
2025 年3 月 8 日
|
Mistral 发布高性能 OCR API,实测表现优异但仍有提升空间
|
|
4
|
0
|
2025 年3 月 8 日
|
昆仑万维发布Matrix-Zero世界模型,以空间智能技术突破2D限制
|
|
7
|
0
|
2025 年3 月 8 日
|
精准定位过拟合特征:ParShap方法解析
|
|
9
|
0
|
2025 年3 月 8 日
|
ToST:基于统计学的线性注意力机制,革新Transformer效率
|
|
7
|
0
|
2025 年3 月 8 日
|
DeepSeek 之后,大模型应用如何迈向新阶段?聚焦 AICon 大会
|
|
1
|
0
|
2025 年3 月 8 日
|
DeepSeek大模型高效训练:极限AI工程优化解析
|
|
6
|
0
|
2025 年3 月 8 日
|
DataMan:浙大&千问团队提出预训练数据管理器,显著提升大语言模型性能
|
|
7
|
0
|
2025 年3 月 8 日
|
DynamicCity:让AI生成的城市“动”起来!突破4D大场景生成技术边界
|
|
9
|
0
|
2025 年3 月 8 日
|
加入数据派,与大数据同行:志愿者招募
|
|
3
|
0
|
2025 年3 月 8 日
|
宽德投资成立智能学习实验室,布局通用人工智能
|
|
8
|
0
|
2025 年3 月 8 日
|
数据派志愿者招募:与一群志同道合的小伙伴,共建数据科学社区!
|
|
5
|
0
|
2025 年3 月 8 日
|