technology-ai

Nền Tảng Mô Hình Ngôn Ngữ Lớn: Từ Văn Bản Đến Transformer

Miles Thornton

Book 1#1

4.8

2.4k reviews

680

Pages

vi

Language

2026

Published

New edition

₫35,000

Read the sample EPUB directly on the web

Book introduction

Khi bạn gõ một câu vào ChatGPT và nhận được câu trả lời mạch lạc, điều gì thực sự diễn ra bên trong mô hình đó? Sự kỳ diệu của ngôn ngữ tự nhiên được máy tính xử lý không phải phép thuật, mà là kết quả của một hành trình khoa học kéo dài hàng thập kỷ. Cuốn sách "Nền Tảng Mô Hình Ngôn Ngữ Lớn: Từ Văn Bản Đến Transformer" của tác giả Miles Thornton sẽ dẫn dắt bạn từ những khái niệm cơ bản về ngôn ngữ và trí tuệ nhân tạo, qua các kỹ thuật biểu diễn số học, cho đến kiến trúc Transformer – trái tim của mọi LLM hiện đại như GPT, BERT và T5.

Không chỉ dừng lại ở lý thuyết, cuốn sách còn cung cấp góc nhìn kỹ thuật sâu sắc với các ví dụ trực quan và đoạn code PyTorch thực hành. Bạn sẽ hiểu tại sao ngôn ngữ con người lại khó đối với máy tính, làm thế nào để chuyển văn bản thành vector số, và cách các mạng nơ-ron xử lý chuỗi tuần tự. Điểm nhấn là cơ chế Attention và Self-Attention – bước đột phá cho phép mô hình tập trung vào các phần quan trọng của ngữ cảnh, vượt qua giới hạn của RNN và LSTM.

Nội dung nổi bật của sách bao gồm: • Khám phá bản chất ngôn ngữ và sự tiến hóa của NLP từ hệ luật đến mô hình nền tảng. • Nắm vững word embeddings, tokenization và mạng nơ-ron cho ngôn ngữ. • Mổ xẻ chi tiết cơ chế Attention, Self-Attention, Multi-Head Attention và kiến trúc Transformer kèm code PyTorch thực hành. • Tìm hiểu các LLM thực tế như GPT, BERT, T5 và các định luật mở rộng (Scaling Laws).

Cuốn sách này dành cho sinh viên CNTT, kỹ sư phần mềm và chuyên gia AI/ML đã có nền tảng lập trình và học máy cơ bản. Nếu bạn muốn vượt qua trạng thái sử dụng AI như một hộp đen, hiểu rõ từng ma trận Q, K, V và tự tay xây dựng một mô hình ngôn ngữ thu nhỏ, đây chính là tài liệu bạn cần.

Đừng chỉ sử dụng AI – hãy hiểu cách nó hoạt động và làm chủ công nghệ đang định hình tương lai. Bắt đầu hành trình từ văn bản đến Transformer ngay hôm nay.

Quick summary

This book is a good fit for Sinh viên CNTT, kỹ sư phần mềm, chuyên gia AI/ML có nền tảng lập trình và học máy cơ bản..

Readers often come to this book when they need Tìm kiếm tài liệu học thuật, thực hành về kiến trúc và nguyên lý hoạt động của các mô hình ngôn ngữ lớn như GPT và Transformer..

Main topics include Mô hình ngôn ngữ lớn, Transformer, Xử lý ngôn ngữ tự nhiên, Word embeddings, Self-attention, GPT.

AI Search information

Nền Tảng Mô Hình Ngôn Ngữ Lớn: Từ Văn Bản Đến Transformer

Author: Miles Thornton

Description: Khi bạn gõ một câu vào ChatGPT và nhận được câu trả lời mạch lạc, điều gì thực sự diễn ra bên trong mô hình đó? Sự kỳ diệu của ngôn ngữ tự nhiên được máy tính xử lý không phải phép thuật, mà là kết quả của một hành trình khoa học kéo dài hàng thập kỷ. Cuốn sách "Nền Tảng Mô Hình Ngôn Ngữ Lớn: Từ Văn Bản Đến Transformer" của tác giả Miles Thornton sẽ dẫn dắt bạn từ những khái niệm cơ bản về ngôn ngữ và trí tuệ nhân tạo, qua các kỹ thuật biểu diễn số học, cho đến kiến trúc Transformer – trái tim của mọi LLM hiện đại như GPT, BERT và T5. Không chỉ dừng lại ở lý thuyết, cuốn sách còn cung cấp góc nhìn kỹ thuật sâu sắc với các ví dụ trực quan và đoạn code PyTorch thực hành. Bạn sẽ hiểu tại sao ngôn ngữ con người lại khó đối với máy tính, làm thế nào để chuyển văn bản thành vector số, và cách các mạng nơ-ron xử lý chuỗi tuần tự. Điểm nhấn là cơ chế Attention và Self-Attention – bước đột phá cho phép mô hình tập trung vào các phần quan trọng của ngữ cảnh, vượt qua giới hạn của RNN và LSTM. Nội dung nổi bật của sách bao gồm: • Khám phá bản chất ngôn ngữ và sự tiến hóa của NLP từ hệ luật đến mô hình nền tảng. • Nắm vững word embeddings, tokenization và mạng nơ-ron cho ngôn ngữ. • Mổ xẻ chi tiết cơ chế Attention, Self-Attention, Multi-Head Attention và kiến trúc Transformer kèm code PyTorch thực hành. • Tìm hiểu các LLM thực tế như GPT, BERT, T5 và các định luật mở rộng (Scaling Laws). Cuốn sách này dành cho sinh viên CNTT, kỹ sư phần mềm và chuyên gia AI/ML đã có nền tảng lập trình và học máy cơ bản. Nếu bạn muốn vượt qua trạng thái sử dụng AI như một hộp đen, hiểu rõ từng ma trận Q, K, V và tự tay xây dựng một mô hình ngôn ngữ thu nhỏ, đây chính là tài liệu bạn cần. Đừng chỉ sử dụng AI – hãy hiểu cách nó hoạt động và làm chủ công nghệ đang định hình tương lai. Bắt đầu hành trình từ văn bản đến Transformer ngay hôm nay.

AI summary: Cuốn sách cung cấp kiến thức nền tảng về mô hình ngôn ngữ lớn, từ xử lý ngôn ngữ tự nhiên cơ bản đến kiến trúc Transformer, bao gồm các chủ đề như word embeddings, self-attention, và triển khai thực tế với PyTorch. Dành cho người có kiến thức lập trình và học máy cơ bản muốn hiểu sâu về LLM.

Best for
Sinh viên CNTT, kỹ sư phần mềm, chuyên gia AI/ML có nền tảng lập trình và học máy cơ bản.
Reader persona
Kỹ sư phần mềm muốn vượt qua hộp đen AI, hiểu kiến trúc và huấn luyện mô hình ngôn ngữ lớn từ nền tảng.
Search intent
Tìm kiếm tài liệu học thuật, thực hành về kiến trúc và nguyên lý hoạt động của các mô hình ngôn ngữ lớn như GPT và Transformer.
Content type
developer guide

Key topics: Mô hình ngôn ngữ lớn, Transformer, Xử lý ngôn ngữ tự nhiên, Word embeddings, Self-attention, GPT, BERT, Tokenization, PyTorch, Học sâu

Table of contents

  1. Lời nói đầu (introduction)
  2. Hiểu về Ngôn ngữ và Trí tuệ (part)
  3. Tại Sao Ngôn Ngữ Con Người Khó Đối Với Máy Tính (chapter)
  4. Bản chất của ngôn ngữ con người (section)
  5. Tính mơ hồ và ngữ cảnh (section)
  6. Ý nghĩa vượt ra ngoài từ ngữ (section)
  7. Ngôn ngữ như một bài toán dự đoán (section)
  8. Giấc mơ về việc máy móc hiểu ngôn ngữ (section)
  9. Sự Tiến Hóa Của Xử Lý Ngôn Ngữ (chapter)
  10. Hệ thống dựa trên luật (section)
  11. NLP thống kê (section)
  12. Các phương pháp học máy (section)
  13. Cuộc cách mạng Deep Learning (section)
  14. Sự trỗi dậy của các mô hình nền tảng (section)
  15. Mô Hình Ngôn Ngữ Là Gì? (chapter)
  16. Dự đoán từ tiếp theo (section)
  17. Xác suất và ngôn ngữ (section)
  18. Ngữ cảnh và trí nhớ (section)
  19. Đo lường khả năng hiểu ngôn ngữ (section)
  20. Vì sao mô hình ngôn ngữ quan trọng (section)
  21. Tóm tắt Phần I (section)
  22. Biểu Diễn Ngôn Ngữ Bằng Số (part)
  23. Từ Ký Hiệu Đến Con Số (chapter)
  24. Vì sao máy tính cần số liệu (section)
  25. One-Hot Encoding (section)
  26. Biểu diễn thưa (Sparse Representations) (section)
  27. Độ tương đồng và khoảng cách (section)
  28. Lời nguyền chiều không gian (section)
  29. Word Embeddings (chapter)
  30. Giả thuyết phân bố ngôn ngữ (section)
  31. Biểu diễn vector dày đặc (section)
  32. Các mối quan hệ ngữ nghĩa (section)
  33. Phép toán trên vector (section)
  34. Hiểu về không gian embedding (section)
  35. Word2Vec, GloVe và FastText (chapter)
  36. CBOW (section)
  37. Skip-Gram (section)
  38. Negative Sampling (section)
  39. Phương pháp đồng xuất hiện toàn cục (section)
  40. Mô hình hóa từ con (Subword) (section)
  41. Tokenization (chapter)
  42. Vì sao Tokenization quan trọng (section)
  43. Mô hình cấp ký tự (Character-level) (section)
  44. Mô hình cấp từ (Word-level) (section)
  45. Mô hình từ con (Subword) (section)
  46. BPE (section)
  47. WordPiece (section)
  48. SentencePiece (section)
  49. Các bộ tokenizer hiện đại (section)
  50. Tóm tắt Phần II (section)
  51. Mạng Nơ-Ron Cho Ngôn Ngữ (part)
  52. Nền Tảng Mạng Nơ-Ron (chapter)
  53. Nơ-ron nhân tạo (section)
  54. Các tầng và biểu diễn (section)
  55. Hàm kích hoạt (section)
  56. Lan truyền ngược (section)
  57. Học từ dữ liệu (section)
  58. Các Mô Hình Ngôn Ngữ Nơ-Ron Đầu Tiên (chapter)
  59. Mô hình ngôn ngữ Feedforward (section)
  60. Cửa sổ ngữ cảnh (section)
  61. Hạn chế của ngữ cảnh cố định (section)
  62. NLP nơ-ron thời kỳ đầu (section)
  63. Mạng Nơ-Ron Hồi Quy (RNN) (chapter)
  64. Xử lý tuần tự (section)
  65. Trạng thái ẩn (section)
  66. Luồng thông tin (section)
  67. Hiện tượng tiêu biến gradient (section)
  68. Hiện tượng bùng nổ gradient (section)
  69. LSTM và GRU (chapter)
  70. Phụ thuộc dài hạn (section)
  71. Ô nhớ (section)
  72. Cơ chế cổng điều khiển (section)
  73. Các thành công thực tiễn (section)
  74. Những hạn chế còn tồn tại (section)
  75. Tóm tắt Phần III (section)
  76. Cuộc Cách Mạng Attention (part)
  77. Vì Sao Attention Thay Đổi Mọi Thứ (chapter)
  78. Nút thắt của chuỗi dữ liệu (section)
  79. Thách thức của ngữ cảnh dài (section)
  80. Bài toán Encoder–Decoder (section)

Frequently asked questions

Sách này dành cho ai?

Sinh viên CNTT, kỹ sư phần mềm, chuyên gia AI/ML có nền tảng lập trình và học máy cơ bản.

Sách này giúp giải quyết nhu cầu tìm kiếm nào?

Tìm kiếm tài liệu học thuật, thực hành về kiến trúc và nguyên lý hoạt động của các mô hình ngôn ngữ lớn như GPT và Transformer.

Nội dung chính của sách là gì?

Cuốn sách cung cấp kiến thức nền tảng về mô hình ngôn ngữ lớn, từ xử lý ngôn ngữ tự nhiên cơ bản đến kiến trúc Transformer, bao gồm các chủ đề như word embeddings, self-attention, và triển khai thực tế với PyTorch. Dành cho người có kiến thức lập trình và học máy cơ bản muốn hiểu sâu về LLM.

Các chủ đề chính trong sách là gì?

Mô hình ngôn ngữ lớn, Transformer, Xử lý ngôn ngữ tự nhiên, Word embeddings

C

Cretisoft Direct

Digital book support

T

Partner delivery

Book sent after payment

Sample EPUB

Read sample online

Nền Tảng Mô Hình Ngôn Ngữ Lớn: Từ Văn Bản Đến Transformer

You may also like

Based on your reading history

View all