This article is also available in English.

Từ những nghiên cứu đầu tiên về trí tuệ nhân tạo cuối thế kỷ thứ 20, ai cũng biết AI vượt trội hơn con người ở nhiều mặt, nhất là về rủi ro mắc sai lầm ở mức tối thiểu. Vì vậy, các nhà khoa học đã gặp không ít khó khăn trong việc đề ra những bài toán nhằm đánh giá khả năng và giới hạn của chúng. Thế nhưng, “có sức người sỏi đá cũng thành cơm”, sau nhiều lần thử và rút kinh nghiệm thì một trong những công ty công nghệ “Big Four” nổi tiếng thế giới – Facebook, đã cho ra mắt bộ đề thi có 1-0-2 của mình với cái tên quen thuộc dạo gần đây:

#howmuchhaveyouchangedchallenge

Trước khi bàn đến “thử thách thể hiện sự thay đổi ở bản thân”, API sẽ kể bạn nghe về phương pháp “chấm thi” của các nhà nghiên cứu về trí thông minh nhân tạo nhé!

(Nguồn ảnh: venturebeat.com)

BENCHMARK hay DYNABENCH

Benchmark, hay còn được biết đến với thuật ngữ “kiểm chuẩn” trong khoa học máy tính, là thao tác chạy một hay nhiều chương trình máy tính nhằm đánh giá kết quả vận hành của một đối tượng. (thường bằng cách chạy một số bài kiểm tra tiêu chuẩn và thử nghiệm giới hạn chịu đựng của nó.)

Benchmark từng đóng một vai trò vô cùng quan trọng trong việc đề ra thử thách, mục tiêu và “barem” cụ thể nhằm giúp AI ngày càng phát triển bằng cách khắc phục những hạn chế trước đó. Nhưng, ở một số lĩnh vực đòi hỏi “tư duy” điển hình như ngôn ngữ học thì cách thức “chấm thi” này được xem như không còn phù hợp vì đặc thù “barem”.

“Douwe Kiela, trưởng nghiên cứu gia tại Facebook AI Research cho biết benchmark là một công cụ rất dễ bị dùng sai. Tập trung quá nhiều vào benchmark có thể khiến bạn đánh mất tầm nhìn khái quát. Vậy nên một một bài kiểm tra sẽ rất dễ trở thành một nhiệm vụ.” (Heaven, 2020)

Thay vì dành nhiều thời gian để khiến AI vượt qua bài thử thách tự mình đặt ra, có mức sàn định sẵn thì Facebook lại áp dụng hướng đi khác, phù hợp hơn với hệ sinh thái của mình là một mạng xã hội với hơn 2.4 tỷ người dùng. Hướng chấm thi mới có tên gọi là “Dynabench”, vốn là sự kết hợp giữa “dynamic data collection” (thu thập dữ liệu giao dịch/động) và “benchmarking” (đối chuẩn – hoạt động so sánh những quá trình và số liệu về hiệu suất).

Dynabench, được Facebook giới thiệu vào tháng 9 năm nay, hoạt động dựa trên nguyên tắc “chú giải đối kháng”, nôm na rằng: nó hoạt động bằng cách thử thách hệ thống học tập của máy móc thông qua các bài thi đối kháng với người.

Ví dụ như một nhà nghiên cứu sẽ đưa ra một lời nhận xét “nhà hàng này lúc trước rất tệ nhưng bây giờ thì khá ổn”, lứa AI cũ (chỉ phân tích từng chữ một) sẽ khó nắm bắt hết ý của câu và đánh cho nhà hàng ⅕ sao. Xong, sau khi nhận được phản hồi số sao của con người là ⅘ thì hệ thống trí thông minh nhân tạo đó sẽ tự rút kinh nghiệm và hình thành nên cách thức đánh giá khác để luyện cho thế hệ tiếp theo không mắc phải sai lầm cũ. Vòng lặp tự động này sẽ tiếp tục cải thiện cho lứa sau, sau nữa, khiến cho AI ngày một phát triển hơn, phương pháp “chấm thi” đó gọi là “Dynabench”. Tham khảo thêm ở: dynabench.org

Vậy những điều này có liên quan gì đến #howmuchhaveyouchangedchallenge ?

Tuy chưa có một động thái chính thức đến từ phía “nhà anh Mark” nhưng chúng ta có thể ngấm ngầm dự đoán được một số chiến thuật tài tình của Facebook nhằm thu thập dữ liệu thích hợp cho việc phát triển Facebook AI. Trở lại với trưởng nghiên cứu gia Kiela đến từ Facebook, ông đã chia sẻ ở bài viết MIT Technology Review rằng:

“…để kiểm tra [tính hiệu quả của] nó, bạn chỉ cần tìm cách giúp mọi người tự đăng tải hình hoặc tranh tự vẽ của họ: ‘Tầm nhìn lâu dài của kế hoạch này là tạo ra một không gian mở nơi mọi người có thể thỏa sức sáng tạo (mô hình) và thu thập dữ liệu của riêng họ.” (Heaven, 2020)

Tóm lại, chúng ta đã và đang tiếp sức cho các nhà nghiên cứu thông qua những tương tác của mình trên nền tảng MXH nói riêng và truyền thông đa phương tiện nói chung. Về phần thử thách nêu trên, những hình ảnh về quá khứ và hiện tại của ta có thể được dùng làm tư liệu cho một bài kiểm tra nào đó của đội ngũ “nhà Mark” đối với đứa con AI của họ.

Xem thêm bài viết chi tiết tại đây.

Bài viết được đóng góp bởi đội ngũ của API.

Nội dung: (Tiếng Việt) Văn Thanh.

Biên dịch: (Tiếng Anh) Thanh Hải.

Ảnh bìa: Trí Dũng.

Để biết thêm thông tin chi tiết, vui lòng liên hệ:

Email: theapitales.contact@gmail.com

Trang chủ: https://www.facebook.com/theapitales

Đường dây nóng: (+84)938327709 (Van Thanh Mr.)

(+84)702440636 (Giang Dang Ms.)

Reference:

Heaven, W. (2020, September 24). Facebook wants to make AI better by asking people to break it. Retrieved November 17, 2020, from https://www.technologyreview.com/2020/09/24/1008882/facebook-ai-test-benchmark-people-break-adversarial/