数据不平衡?千万不要随意处理!
阅13转0刚刚视觉全能!自回归要反超扩散?Lumina-mGPT:任意分辨率丝滑逼真图像生成(上海AI Lab)
阅14转0刚刚《Python 机器学习》作者新作:从头开始构建大型语言模型,代码已开源
阅12转1刚刚超越L-M和G-N!最新图优化框架!全面提升SLAM定位精度!
阅166转0刚刚从LLM中完全消除矩阵乘法,效果出奇得好,10亿参数跑在FPGA上接近大脑功耗
阅65转0刚刚GQA,MLA之外的另一种KV Cache压缩方式:动态内存压缩(DMC)
阅63转0刚刚损失函数(Loss Function)
阅422转0刚刚白话系列丨到底什么是深度学习?说人话搞懂所有重要概念
阅101转0刚刚LLMs可以进行任务规划吗?如果不行,LLMs GNN可以吗?
阅15转0刚刚多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」
阅1转0刚刚开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?
阅85转1刚刚YOLOv10问世:性能大幅提升,登上GitHub热榜
阅4转0刚刚2024 || 时间序列的基础模型综述:使用大语言模型泛化时间序列表征
阅107转1刚刚综述170篇「自监督学习」推荐算法,港大发布SSL4Rec:代码、资料库全面开源!
阅11转0刚刚时间序列概率预测的共形预测
阅217转1刚刚最通俗易懂的KNN算法讲解
阅607转3刚刚ControlNet作者放大招!IC-Light:控制生成图片光照效果!
阅45转1刚刚图灵奖得主LeCun哈佛演讲PPT放出:唱衰自回归LLM,指明下一代AI方向
阅8转0刚刚15种时间序列预测方法总结(包含多种方法代码实现)
阅1391转1刚刚乌克兰程序员发明新编程语言,同时亦是一种大数据结构
阅11转0刚刚
-
设计心理学2:与复杂共处
加载中...