technology-ai

Huấn Luyện Mô Hình Ngôn Ngữ Lớn: Tiền Huấn Luyện, Căn Chỉnh và Mở Rộng Quy Mô Hệ Thống AI Hiện Đại

Miles Thornton

Book 3#3

4.8

2.4k değerlendirme

654

Sayfa

vi

Dil

2026

Yayınlandı

Yeni baskı

₫35,000

EPUB örneğini webde oku

Kitap tanıtımı

Khi một mô hình ngôn ngữ lớn 70 tỷ tham số thất bại trong bài kiểm tra toán lớp 5, nguyên nhân không nằm ở kiến trúc Transformer – mà nằm ở cách bạn đã huấn luyện nó. Huấn luyện LLM không chỉ là bài toán tối ưu hóa hàm mất mát; nó là cuộc chơi của các ràng buộc phần cứng, chi phí tính toán và động lực học gradient. Nếu bạn đang đau đầu vì loss spike, gradient explosion, hay không biết nên chọn data parallelism hay tensor parallelism, cuốn sách này dành cho bạn.

Cuốn sách "Huấn Luyện Mô Hình Ngôn Ngữ Lớn: Tiền Huấn Luyện, Căn Chỉnh và Mở Rộng Quy Mô Hệ Thống AI Hiện Đại" là một tài liệu tham khảo kỹ thuật toàn diện, bao quát toàn bộ vòng đời của một LLM từ dữ liệu thô đến trợ lý AI được căn chỉnh. Với 32 chương được chia thành 8 phần, tác giả Miles Thornton dẫn dắt bạn qua từng giai đoạn: kinh tế học tính toán, toán học pretraining, scaling laws, hệ thống phân tán, đánh giá, instruction tuning, và alignment. Đây không phải là sách lý thuyết suông – mỗi khái niệm đều được phân tích qua lăng kính kỹ thuật hệ thống và kèm theo các trade-off thực tế.

Điểm nổi bật của cuốn sách: • Hiểu sâu về scaling laws (Kaplan, Chinchilla) để phân bổ compute budget tối ưu giữa model size và data size. • Làm chủ các chiến lược phân tán: từ data parallelism đến FSDP/ZeRO, tensor parallelism và pipeline parallelism. • Nắm vững quy trình alignment: từ reward modeling, RLHF (PPO) đến DPO, ORPO và GRPO dành cho suy luận logic.

Ai nên đọc cuốn sách này? Kỹ sư Machine Learning, nhà nghiên cứu AI, và nghiên cứu sinh sau đại học chuyên ngành Deep Learning – những người đã có nền tảng vững về Transformer và muốn bước lên tầm cao mới: thiết kế và vận hành pipeline huấn luyện LLM cỡ hàng tỷ tham số. Sách phù hợp cho cả người mới bắt đầu mở rộng quy mô lẫn chuyên gia muốn hệ thống hóa kiến thức.

Đừng để việc huấn luyện LLM trở thành hộp đen. Cuốn sách này sẽ trang bị cho bạn công cụ phân tích và ra quyết định dựa trên bằng chứng, giúp bạn tối ưu từ FLOPs đầu tiên cho đến lần căn chỉnh cuối cùng.

Kısa özet

Bu kitap şunlar için uygundur Kỹ sư Machine Learning, nhà nghiên cứu AI, nghiên cứu sinh sau đại học chuyên ngành Deep Learning.

Okurlar genelde şu ihtiyaçla gelir Người đọc tìm kiếm tài liệu kỹ thuật chi tiết, cập nhật về các phương pháp huấn luyện, căn chỉnh và mở rộng quy mô mô hình ngôn ngữ lớn để áp dụng vào công việc hoặc nghiên cứu..

Ana konular şunları içerir Pretraining LLM, Scaling Laws (Kaplan, Chinchilla), Distributed Training (Data Parallelism, Tensor Parallelism, Pipeline Parallelism), Mixed Precision Training, Instruction Tuning, Reinforcement Learning from Human Feedback (RLHF).

AI Search bilgileri

Huấn Luyện Mô Hình Ngôn Ngữ Lớn: Tiền Huấn Luyện, Căn Chỉnh và Mở Rộng Quy Mô Hệ Thống AI Hiện Đại

Author: Miles Thornton

Description: Khi một mô hình ngôn ngữ lớn 70 tỷ tham số thất bại trong bài kiểm tra toán lớp 5, nguyên nhân không nằm ở kiến trúc Transformer – mà nằm ở cách bạn đã huấn luyện nó. Huấn luyện LLM không chỉ là bài toán tối ưu hóa hàm mất mát; nó là cuộc chơi của các ràng buộc phần cứng, chi phí tính toán và động lực học gradient. Nếu bạn đang đau đầu vì loss spike, gradient explosion, hay không biết nên chọn data parallelism hay tensor parallelism, cuốn sách này dành cho bạn. Cuốn sách "Huấn Luyện Mô Hình Ngôn Ngữ Lớn: Tiền Huấn Luyện, Căn Chỉnh và Mở Rộng Quy Mô Hệ Thống AI Hiện Đại" là một tài liệu tham khảo kỹ thuật toàn diện, bao quát toàn bộ vòng đời của một LLM từ dữ liệu thô đến trợ lý AI được căn chỉnh. Với 32 chương được chia thành 8 phần, tác giả Miles Thornton dẫn dắt bạn qua từng giai đoạn: kinh tế học tính toán, toán học pretraining, scaling laws, hệ thống phân tán, đánh giá, instruction tuning, và alignment. Đây không phải là sách lý thuyết suông – mỗi khái niệm đều được phân tích qua lăng kính kỹ thuật hệ thống và kèm theo các trade-off thực tế. Điểm nổi bật của cuốn sách: • Hiểu sâu về scaling laws (Kaplan, Chinchilla) để phân bổ compute budget tối ưu giữa model size và data size. • Làm chủ các chiến lược phân tán: từ data parallelism đến FSDP/ZeRO, tensor parallelism và pipeline parallelism. • Nắm vững quy trình alignment: từ reward modeling, RLHF (PPO) đến DPO, ORPO và GRPO dành cho suy luận logic. Ai nên đọc cuốn sách này? Kỹ sư Machine Learning, nhà nghiên cứu AI, và nghiên cứu sinh sau đại học chuyên ngành Deep Learning – những người đã có nền tảng vững về Transformer và muốn bước lên tầm cao mới: thiết kế và vận hành pipeline huấn luyện LLM cỡ hàng tỷ tham số. Sách phù hợp cho cả người mới bắt đầu mở rộng quy mô lẫn chuyên gia muốn hệ thống hóa kiến thức. Đừng để việc huấn luyện LLM trở thành hộp đen. Cuốn sách này sẽ trang bị cho bạn công cụ phân tích và ra quyết định dựa trên bằng chứng, giúp bạn tối ưu từ FLOPs đầu tiên cho đến lần căn chỉnh cuối cùng.

AI summary: Cuốn sách cung cấp kiến thức chuyên sâu về toàn bộ vòng đời huấn luyện LLM, bao gồm pretraining, tối ưu hóa, scaling laws, hệ thống huấn luyện phân tán, instruction tuning và alignment (RLHF, DPO, GRPO). Dành cho kỹ sư ML và nhà nghiên cứu AI muốn thiết kế và vận hành pipeline huấn luyện mô hình ngôn ngữ lớn hiệu quả.

Uygun okuyucu
Kỹ sư Machine Learning, nhà nghiên cứu AI, nghiên cứu sinh sau đại học chuyên ngành Deep Learning
Okur profili
Một kỹ sư ML hoặc nhà nghiên cứu AI đã có kiến thức về Transformer và deep learning, muốn hiểu sâu và triển khai pipeline huấn luyện LLM quy mô lớn từ pretraining đến alignment.
Arama amacı
Người đọc tìm kiếm tài liệu kỹ thuật chi tiết, cập nhật về các phương pháp huấn luyện, căn chỉnh và mở rộng quy mô mô hình ngôn ngữ lớn để áp dụng vào công việc hoặc nghiên cứu.
İçerik türü
technical guide

Key topics: Pretraining LLM, Scaling Laws (Kaplan, Chinchilla), Distributed Training (Data Parallelism, Tensor Parallelism, Pipeline Parallelism), Mixed Precision Training, Instruction Tuning, Reinforcement Learning from Human Feedback (RLHF), Direct Preference Optimization (DPO), Mixture of Experts (MoE), Model Evaluation và Benchmark, AI Alignment và Safety

İçindekiler

  1. Lời nói đầu (introduction)
  2. Vòng Đời Huấn Luyện Mô Hình (part)
  3. Từ Dữ Liệu Đến Mô Hình (chapter)
  4. Quy trình huấn luyện LLM (section)
  5. Dữ liệu, tham số và năng lực tính toán (section)
  6. Các giai đoạn phát triển mô hình (section)
  7. Mục tiêu huấn luyện (section)
  8. Tiêu chí đánh giá thành công (section)
  9. Hiểu Về Năng Lực Tính Toán (chapter)
  10. FLOPs (section)
  11. Bộ nhớ GPU (section)
  12. Thông lượng huấn luyện (section)
  13. Chi phí huấn luyện (section)
  14. Những thách thức khi mở rộng quy mô (section)
  15. Kinh Tế Học Của Việc Huấn Luyện Mô Hình (chapter)
  16. Ngân sách tính toán (section)
  17. Đánh đổi khi mở rộng quy mô (section)
  18. Hiệu quả dữ liệu (section)
  19. Hiệu quả mô hình (section)
  20. Các giới hạn thực tế (section)
  21. Tiền Huấn Luyện Mô Hình Ngôn Ngữ (part)
  22. Mô Hình Ngôn Ngữ Tự Hồi Quy (chapter)
  23. Dự đoán token tiếp theo (section)
  24. Mô hình hóa ngữ cảnh (section)
  25. Teacher forcing (section)
  26. Động lực học trong quá trình huấn luyện (section)
  27. Mục Tiêu Masked Và Denoising (chapter)
  28. Masked Language Modeling (section)
  29. Span Corruption (section)
  30. Mục tiêu huấn luyện của T5 (section)
  31. Phân tích so sánh (section)
  32. Hàm Mất Mát Và Tối Ưu Hóa (chapter)
  33. Cross Entropy (section)
  34. Perplexity (section)
  35. Mục tiêu tối ưu hóa (section)
  36. Hành vi của gradient (section)
  37. Các Thuật Toán Tối Ưu (chapter)
  38. SGD (section)
  39. Adam (section)
  40. AdamW (section)
  41. Các bộ tối ưu thích nghi (section)
  42. Xu hướng hiện đại (section)
  43. Chiến Lược Learning Rate (chapter)
  44. Warmup (section)
  45. Cosine Decay (section)
  46. Các lịch điều chỉnh learning rate (section)
  47. Những yếu tố ảnh hưởng đến độ ổn định (section)
  48. Mở Rộng Quy Mô Huấn Luyện (part)
  49. Các Quy Luật Scaling (chapter)
  50. Kaplan Scaling Laws (section)
  51. Chinchilla Scaling Laws (section)
  52. Huấn luyện tối ưu theo compute (section)
  53. Mở rộng dữ liệu huấn luyện (section)
  54. Độ Ổn Định Khi Huấn Luyện (chapter)
  55. Gradient explosion (section)
  56. Gradient clipping (section)
  57. Ổn định số học (section)
  58. Các lỗi thường gặp khi huấn luyện (section)
  59. Huấn Luyện Với Mixed Precision (chapter)
  60. FP32 (section)
  61. FP16 (section)
  62. BF16 (section)
  63. Hiệu quả sử dụng bộ nhớ (section)
  64. Checkpoint Và Khôi Phục Huấn Luyện (chapter)
  65. Lưu tiến trình huấn luyện (section)
  66. Tiếp tục huấn luyện từ checkpoint (section)
  67. Khả năng chịu lỗi (section)
  68. Các lần huấn luyện kéo dài (section)
  69. Hệ Thống Huấn Luyện Phân Tán (part)
  70. Vì Sao Cần Huấn Luyện Phân Tán (chapter)
  71. Giới hạn bộ nhớ (section)
  72. Giới hạn tính toán (section)
  73. Thách thức khi mở rộng quy mô (section)
  74. Song Song Dữ Liệu (chapter)
  75. Nhân bản mô hình (section)
  76. Đồng bộ hóa (section)
  77. Chi phí giao tiếp giữa các GPU (section)
  78. Song Song Mô Hình (chapter)
  79. Tensor Parallelism (section)
  80. Pipeline Parallelism (section)

Sık sorulan sorular

Sách này dành cho ai?

Kỹ sư Machine Learning, nhà nghiên cứu AI, nghiên cứu sinh sau đại học chuyên ngành Deep Learning

Sách này giúp giải quyết nhu cầu tìm kiếm nào?

Người đọc tìm kiếm tài liệu kỹ thuật chi tiết, cập nhật về các phương pháp huấn luyện, căn chỉnh và mở rộng quy mô mô hình ngôn ngữ lớn để áp dụng vào công việc hoặc nghiên cứu.

Nội dung chính của sách là gì?

Cuốn sách cung cấp kiến thức chuyên sâu về toàn bộ vòng đời huấn luyện LLM, bao gồm pretraining, tối ưu hóa, scaling laws, hệ thống huấn luyện phân tán, instruction tuning và alignment (RLHF, DPO, GRPO). Dành cho kỹ sư ML và nhà nghiên cứu AI muốn thiết kế và vận hành pipeline huấn luyện mô hình ngôn ngữ lớn hiệu quả.

Các chủ đề chính trong sách là gì?

Pretraining LLM, Scaling Laws (Kaplan, Chinchilla), Distributed Training (Data Parallelism, Tensor Parallelism, Pipeline Parallelism), Mixed Precision Training

C

Cretisoft Direct

Dijital kitap desteği

T

Partner teslimatı

Kitap ödeme sonrası gönderilir

Sample EPUB

Read sample online

Huấn Luyện Mô Hình Ngôn Ngữ Lớn: Tiền Huấn Luyện, Căn Chỉnh và Mở Rộng Quy Mô Hệ Thống AI Hiện Đại

Bunları da sevebilirsiniz

Okuma geçmişinize göre

Tümünü gör