机器学习 – 既智新闻

周日. 12 月 14th, 2025

AI生成 IT 机器学习

ML笔记：利用 DeepSeek 的 GPRO 算法优化 LLM 在金融文本和数据预测中的性能

2025年3月20日

1. 引言：LLM 在金融分析与预测中日…

AI生成机器学习

ML笔记：actual counterfactual prediction 反事实预测为什么重要

2024年9月6日

反事实预测：洞悉因果，驱动决策反事实预…

AI生成机器学习

ML笔记：机器学习中的协变量是什么？

2024年8月28日

在机器学习中，协变量（covariate…

AI生成智能新闻机器学习

AI内容农场：垃圾还是宝藏？

2024年8月23日

AI 内容农场：机遇与挑战并存近年来，…

IT 机器学习

Cursor 与OpenAI合作的编程工具，集成GPT-4

2024年8月22日

An IDE designed to b…

AI AI生成机器学习

ML笔记：在大语言模型中，监督微调（SFT）和对齐（PPO、DPO）有什么不同的作用？

2024年8月15日

在大语言模型（LLM）中，监督微调（SF…

AI生成机器学习

ML笔记：PyTorch 监控 GPU 内存使用情况

2024年8月13日

torch.cuda.max_memor…

AI生成机器学习

ML笔记：alpaca-data-gpt4-chinese数据集是什么？

2024年8月13日

Alpaca-Data-GPT4-Chi…

IT 机器学习

ML笔记：什么是组相对策略优化 (GRPO)？

2024年8月11日

什么是组相对策略优化 (GRPO)？ @…

AI生成机器学习

ML笔记：fuggingface datasets 怎么自定义函数筛选数据

2024年8月10日

在 HuggingFace 的 data…

AI生成机器学习

ML笔记：peft库使用qlora微调llm，参数r和lora_alpha的作用和建议的配置值

2024年8月10日

在使用QLoRA算法微调大型语言模型（L…

AI生成机器学习

ML笔记：使用huggingface 开发的trl库进行大模型微调时，SFTTrainer 怎么配置模型结果保存频次的参数

2024年8月10日

在使用 Hugging Face 开发的…

AI生成 IT 机器学习

ML笔记：trl库 SFTTrainer的参数warmup_steps的作用和应该怎么配置

2024年8月10日

warmup_steps 是 SFTTr…