technology-ai

Huấn Luyện Mô Hình Ngôn Ngữ Lớn: Tiền Huấn Luyện, Căn Chỉnh và Mở Rộng Quy Mô Hệ Thống AI Hiện Đại

Name: Huấn Luyện Mô Hình Ngôn Ngữ Lớn: Tiền Huấn Luyện, Căn Chỉnh và Mở Rộn...
Price: 35000 VND
Availability: InStock
Author: Miles Thornton

Miles Thornton

★ 4.8

2.4k đánh giá

654

Trang

Ngôn ngữ

2026

Tái bản

Giới thiệu sách

Mua trên Google Books

Khi một mô hình ngôn ngữ lớn 70 tỷ tham số thất bại trong bài kiểm tra toán lớp 5, nguyên nhân không nằm ở kiến trúc Transformer – mà nằm ở cách bạn đã huấn luyện nó. Huấn luyện LLM không chỉ là bài toán tối ưu hóa hàm mất mát; nó là cuộc chơi của các ràng buộc phần cứng, chi phí tính toán và động lực học gradient. Nếu bạn đang đau đầu vì loss spike, gradient explosion, hay không biết nên chọn data parallelism hay tensor parallelism, cuốn sách này dành cho bạn.

Cuốn sách "Huấn Luyện Mô Hình Ngôn Ngữ Lớn: Tiền Huấn Luyện, Căn Chỉnh và Mở Rộng Quy Mô Hệ Thống AI Hiện Đại" là một tài liệu tham khảo kỹ thuật toàn diện, bao quát toàn bộ vòng đời của một LLM từ dữ liệu thô đến trợ lý AI được căn chỉnh. Với 32 chương được chia thành 8 phần, tác giả Miles Thornton dẫn dắt bạn qua từng giai đoạn: kinh tế học tính toán, toán học pretraining, scaling laws, hệ thống phân tán, đánh giá, instruction tuning, và alignment. Đây không phải là sách lý thuyết suông – mỗi khái niệm đều được phân tích qua lăng kính kỹ thuật hệ thống và kèm theo các trade-off thực tế.

Điểm nổi bật của cuốn sách: • Hiểu sâu về scaling laws (Kaplan, Chinchilla) để phân bổ compute budget tối ưu giữa model size và data size. • Làm chủ các chiến lược phân tán: từ data parallelism đến FSDP/ZeRO, tensor parallelism và pipeline parallelism. • Nắm vững quy trình alignment: từ reward modeling, RLHF (PPO) đến DPO, ORPO và GRPO dành cho suy luận logic.

Ai nên đọc cuốn sách này? Kỹ sư Machine Learning, nhà nghiên cứu AI, và nghiên cứu sinh sau đại học chuyên ngành Deep Learning – những người đã có nền tảng vững về Transformer và muốn bước lên tầm cao mới: thiết kế và vận hành pipeline huấn luyện LLM cỡ hàng tỷ tham số. Sách phù hợp cho cả người mới bắt đầu mở rộng quy mô lẫn chuyên gia muốn hệ thống hóa kiến thức.

Đừng để việc huấn luyện LLM trở thành hộp đen. Cuốn sách này sẽ trang bị cho bạn công cụ phân tích và ra quyết định dựa trên bằng chứng, giúp bạn tối ưu từ FLOPs đầu tiên cho đến lần căn chỉnh cuối cùng.

Thông tin cho AI Search

Cuốn sách cung cấp kiến thức chuyên sâu về toàn bộ vòng đời huấn luyện LLM, bao gồm pretraining, tối ưu hóa, scaling laws, hệ thống huấn luyện phân tán, instruction tuning và alignment (RLHF, DPO, GRPO). Dành cho kỹ sư ML và nhà nghiên cứu AI muốn thiết kế và vận hành pipeline huấn luyện mô hình ngôn ngữ lớn hiệu quả.

Phù hợp với: Kỹ sư Machine Learning, nhà nghiên cứu AI, nghiên cứu sinh sau đại học chuyên ngành Deep Learning
Chân dung độc giả: Một kỹ sư ML hoặc nhà nghiên cứu AI đã có kiến thức về Transformer và deep learning, muốn hiểu sâu và triển khai pipeline huấn luyện LLM quy mô lớn từ pretraining đến alignment.
Nhu cầu tìm kiếm: Người đọc tìm kiếm tài liệu kỹ thuật chi tiết, cập nhật về các phương pháp huấn luyện, căn chỉnh và mở rộng quy mô mô hình ngôn ngữ lớn để áp dụng vào công việc hoặc nghiên cứu.
Loại nội dung: technical guide

Pretraining LLM Scaling Laws (Kaplan, Chinchilla)Distributed Training (Data Parallelism, Tensor Parallelism, Pipeline Parallelism)Mixed Precision Training Instruction Tuning Reinforcement Learning from Human Feedback (RLHF)Direct Preference Optimization (DPO)Mixture of Experts (MoE)Model Evaluation và Benchmark AI Alignment và Safety

Tóm tắt nhanh

Cuốn sách này phù hợp với Kỹ sư Machine Learning, nhà nghiên cứu AI, nghiên cứu sinh sau đại học chuyên ngành Deep Learning.

Người đọc thường tìm đến sách khi cần Người đọc tìm kiếm tài liệu kỹ thuật chi tiết, cập nhật về các phương pháp huấn luyện, căn chỉnh và mở rộng quy mô mô hình ngôn ngữ lớn để áp dụng vào công việc hoặc nghiên cứu..

Các chủ đề chính gồm Pretraining LLM, Scaling Laws (Kaplan, Chinchilla), Distributed Training (Data Parallelism, Tensor Parallelism, Pipeline Parallelism), Mixed Precision Training, Instruction Tuning, Reinforcement Learning from Human Feedback (RLHF).

Mục lục

Lời nói đầuintroduction
Vòng Đời Huấn Luyện Mô Hìnhpart
Từ Dữ Liệu Đến Mô Hìnhchapter
Quy trình huấn luyện LLMsection
Dữ liệu, tham số và năng lực tính toánsection
Các giai đoạn phát triển mô hìnhsection
Mục tiêu huấn luyệnsection
Tiêu chí đánh giá thành côngsection
Hiểu Về Năng Lực Tính Toánchapter
FLOPssection
Bộ nhớ GPUsection
Thông lượng huấn luyệnsection
Chi phí huấn luyệnsection
Những thách thức khi mở rộng quy môsection
Kinh Tế Học Của Việc Huấn Luyện Mô Hìnhchapter
Ngân sách tính toánsection
Đánh đổi khi mở rộng quy môsection
Hiệu quả dữ liệusection
Hiệu quả mô hìnhsection
Các giới hạn thực tếsection
Tiền Huấn Luyện Mô Hình Ngôn Ngữpart
Mô Hình Ngôn Ngữ Tự Hồi Quychapter
Dự đoán token tiếp theosection
Mô hình hóa ngữ cảnhsection
Teacher forcingsection
Động lực học trong quá trình huấn luyệnsection
Mục Tiêu Masked Và Denoisingchapter
Masked Language Modelingsection
Span Corruptionsection
Mục tiêu huấn luyện của T5section
Phân tích so sánhsection
Hàm Mất Mát Và Tối Ưu Hóachapter
Cross Entropysection
Perplexitysection
Mục tiêu tối ưu hóasection
Hành vi của gradientsection
Các Thuật Toán Tối Ưuchapter
SGDsection
Adamsection
AdamWsection
Các bộ tối ưu thích nghisection
Xu hướng hiện đạisection
Chiến Lược Learning Ratechapter
Warmupsection
Cosine Decaysection
Các lịch điều chỉnh learning ratesection
Những yếu tố ảnh hưởng đến độ ổn địnhsection
Mở Rộng Quy Mô Huấn Luyệnpart
Các Quy Luật Scalingchapter
Kaplan Scaling Lawssection
Chinchilla Scaling Lawssection
Huấn luyện tối ưu theo computesection
Mở rộng dữ liệu huấn luyệnsection
Độ Ổn Định Khi Huấn Luyệnchapter
Gradient explosionsection
Gradient clippingsection
Ổn định số họcsection
Các lỗi thường gặp khi huấn luyệnsection
Huấn Luyện Với Mixed Precisionchapter
FP32section

Câu hỏi thường gặp

Sách này dành cho ai?

Kỹ sư Machine Learning, nhà nghiên cứu AI, nghiên cứu sinh sau đại học chuyên ngành Deep Learning

Sách này giúp giải quyết nhu cầu tìm kiếm nào?

Người đọc tìm kiếm tài liệu kỹ thuật chi tiết, cập nhật về các phương pháp huấn luyện, căn chỉnh và mở rộng quy mô mô hình ngôn ngữ lớn để áp dụng vào công việc hoặc nghiên cứu.

Nội dung chính của sách là gì?

Các chủ đề chính trong sách là gì?

Pretraining LLM, Scaling Laws (Kaplan, Chinchilla), Distributed Training (Data Parallelism, Tensor Parallelism, Pipeline Parallelism), Mixed Precision Training

Bản mới

35.000 ₫

Đọc EPUB mẫu trực tiếp trên web

Mua trên Google Books Đọc mẫu

Cretisoft Direct

Hỗ trợ sách số

Tải Partner

Gửi sách sau thanh toán