Bài 1. Giới thiệu về học máy trang 126, 127, 128 SGK Tin học 12 Cánh diều
Cho Hình 1 và ba nhãn phân loại là “vuông”, “tròn”, “tam giác”.
CH tr 126
Cho Hình 1 và ba nhãn phân loại là “vuông”, “tròn”, “tam giác”. Cần gán nhãn phân loại cho từng đối tượng trong Hình 1. Em hãy trả lời các câu hỏi sau:
1) Nếu con người thực hiện nhiệm vụ trên là dễ hay khó?
2) Theo em, máy tính có thể tự động thực hiện nhiệm vụ trên thay cho con người hay không? Lập trình để máy tính làm công việc này là dễ hay khó?
Phương pháp giải:
1) Đối với con người công việc này rất dễ thực hiện.
2) Máy tính có thể tự động thực hiện nhiệm vụ thay con người nhưng việc lập trình sẽ khó.
Lời giải chi tiết:
1) Đối với con người:
- Dễ dàng:
+ Hình ảnh có độ phân giải cao, các đối tượng được phân biệt rõ ràng.
+ Các hình dạng cơ bản (vuông, tròn, tam giác) dễ nhận biết.
+ Nhiệm vụ chỉ yêu cầu gán nhãn đúng cho từng đối tượng.
2) Đối với máy tính:
Có thể:
- Sử dụng các thuật toán học máy, cụ thể là phân loại hình ảnh, để tự động gán nhãn cho các đối tượng.
- Các mô hình học máy đã được huấn luyện trên tập dữ liệu ảnh lớn có thể nhận diện các hình dạng cơ bản với độ chính xác cao.
Lập trình:
- Khó:
+ Yêu cầu kiến thức chuyên môn về học máy, xử lý ảnh và lập trình.
+ Cần thu thập và chuẩn bị tập dữ liệu huấn luyện phù hợp.
+ Lựa chọn và điều chỉnh mô hình học máy phù hợp với nhiệm vụ.
Tuy nhiên:
- Việc lập trình sẽ dễ dàng hơn nếu sử dụng các thư viện và công cụ học máy có sẵn.
- Có nhiều mô hình học máy được phát triển sẵn có thể áp dụng cho bài toán phân loại hình ảnh.
CH tr 128
Xét các bài toán sau:
1) Hệ thống thư điện tử cần xác định các email nghi là thư rác và đánh dấu nó thuộc loại “Spam” (thư rác) để cảnh báo cho người nhận. Những email còn lại thuộc loại “no spam”.
2) Ngân hàng cần xác định khách hàng thuộc loại “tốt”, “bình thường” hay “xấu” để giải quyết định hạn mức cho vay và lãi suất áp dụng
Theo em, những bài toán trên và nhiệm vụ ở phần khởi động có những điểm chung là gì?
Phương pháp giải:
Cả ba bài toán đều thuộc dạng phân loại yêu cầu sử dụng thuật toán và dữ liệu để hoàn thành yêu cầu.
Lời giải chi tiết:
- Cả ba bài toán đều là bài toán phân loại:
- Phân loại email thành "Spam" và "no spam".
- Phân loại khách hàng thành "tốt", "bình thường" và "xấu".
- Phân loại hình ảnh thành "vuông", "tròn" và "tam giác".
- Cả ba bài toán đều sử dụng thuật toán học máy để phân loại dữ liệu.
- Cả ba bài toán đều cần thu thập và chuẩn bị tập dữ liệu huấn luyện phù hợp.
CH tr 129
Cho một số quả, theo em máy tính có trả lời được mấy loại quả hay không?
Phương pháp giải:
Máy tính có thể trả lời được có mấy loại quả.
Lời giải chi tiết:
Hiện nay, với sự phát triển của công nghệ học máy, đặc biệt là mạng nơ-ron nhân tạo, máy tính có thể đạt được độ chính xác cao trong việc phân loại quả.
CH tr 132 LT
Mỗi phát biểu sau về học máy là đúng hay sai?
a) Học không giám sát sử dụng dữ liệu huấn luyện không có nhãn.
b) Học có giám sát sử dụng dữ liệu kiểm tra để đánh giá kết quả huấn luyện.
c) Học có giám sát dành cho huấn luyện máy tính phân cụm.
d) Học có giám sát và không giám sát đều giúp máy tính giải quyết cùng một bài toán như nhau.
Phương pháp giải:
Câu a, b đúng
Câu c,d sai.
Lời giải chi tiết:
a) Học không giám sát sử dụng dữ liệu huấn luyện không có nhãn.
Đúng. Học không giám sát sử dụng dữ liệu huấn luyện không có nhãn, nghĩa là không có thông tin về kết quả mong muốn cho mỗi ví dụ. Mô hình học máy sẽ tự tìm ra các cấu trúc và mối tương quan trong dữ liệu.
b) Học có giám sát sử dụng dữ liệu kiểm tra để đánh giá kết quả huấn luyện.
Đúng. Học có giám sát sử dụng dữ liệu kiểm tra để đánh giá kết quả huấn luyện. Dữ liệu kiểm tra không được sử dụng trong quá trình huấn luyện để đảm bảo tính khách quan khi đánh giá hiệu suất của mô hình.
c) Học có giám sát dành cho huấn luyện máy tính phân cụm.
Sai. Học có giám sát không dành cho huấn luyện máy tính phân cụm. Máy tính phân cụm là một kỹ thuật học không giám sát được sử dụng để nhóm các dữ liệu tương tự nhau lại với nhau.
d) Học có giám sát và không giám sát đều giúp máy tính giải quyết cùng một bài toán như nhau.
Sai. Học có giám sát và không giám sát giúp máy tính giải quyết các bài toán khác nhau. Học có giám sát được sử dụng cho các bài toán phân loại, dự đoán, trong khi học không giám sát được sử dụng cho các bài toán phân cụm, giảm chiều, phát hiện điểm bất thường.
CH tr 132 VD
ChatGPT là một hệ thống AI nổi tiếng có nhiều khả năng khác nhau. Hãy kể ra một vài khả năng mà theo em có sự đóng góp của học máy để phát triển hệ thống này
Phương pháp giải:
Học máy đóng một vai trò vô cùng quan trọng trong phát triển và hoàn thiện ChatGPT.
Lời giải chi tiết:
Học máy đóng góp to lớn vào sự phát triển của ChatGPT bằng cách:
- Huấn luyện ChatGPT trên một lượng lớn dữ liệu.
- Giúp ChatGPT học cách nhận biết các mẫu trong dữ liệu và sử dụng các mẫu đó để thực hiện các nhiệm vụ khác nhau.
- Cải thiện hiệu suất của ChatGPT theo thời gian.
CH tr 132 KT1
Học máy là gì? Sự khác nhau giữa học có giám sát và học không giám sát là gì?
Phương pháp giải:
Học máy là một nhánh của trí tuệ nhân tạo (AI) cho phép máy tính học hỏi từ dữ liệu và tự cải thiện hiệu suất theo thời gian mà không cần được lập trình rõ ràng.
Lời giải chi tiết:
- Học máy là một nhánh của trí tuệ nhân tạo (AI) cho phép máy tính học hỏi từ dữ liệu và tự cải thiện hiệu suất theo thời gian mà không cần được lập trình rõ ràng.
- Phân biệt học có giám sát và học không giám sát
+ Học có giám sát:
- Sử dụng dữ liệu có nhãn, nghĩa là mỗi ví dụ dữ liệu được gắn với kết quả mong muốn.
- Ví dụ: Dữ liệu huấn luyện cho hệ thống phân loại ảnh mèo và chó có thể bao gồm hình ảnh của mèo và chó được gắn nhãn "mèo" hoặc "chó".
- Mục tiêu: Học cách dự đoán chính xác kết quả cho dữ liệu mới.
+ Học không giám sát:
- Sử dụng dữ liệu không có nhãn.
- Ví dụ: Dữ liệu huấn luyện cho hệ thống phân cụm khách hàng có thể bao gồm thông tin về hành vi mua hàng của khách hàng.
- Mục tiêu: Tìm ra các cấu trúc và mối tương quan ẩn trong dữ liệu.
CH tr 132 KT2
Hãy kể một vài ứng dụng cụ thể trong đó có thể sử dụng học máy để thực hiện nhiệm vụ phân loại và phân cụm.
Phương pháp giải:
Một số ứng dụng: google photos, netflix, amazon,...
Lời giải chi tiết:
Một vài ứng dụng cụ thể trong đó có thể sử dụng học máy để thực hiện nhiệm vụ phân loại và phân cụm:
- Google Photos: Google Photos sử dụng học máy để phân loại ảnh theo khuôn mặt, địa điểm và các đối tượng trong ảnh.
- Netflix: Netflix sử dụng học máy để đề xuất phim và chương trình truyền hình cho người dùng dựa trên lịch sử xem phim của họ.
- Amazon: Amazon sử dụng học máy để đề xuất sản phẩm cho khách hàng dựa trên lịch sử mua hàng của họ.