Sunday, November 24, 2024
Trang chủGóc nhìn mớiTQ hy vọng tạo ra 'nhà khoa học AI'

TQ hy vọng tạo ra ‘nhà khoa học AI’

Các nhà nghiên cứu Trung Quốc hy vọng đào tạo các mô hình máy học tạo ra ‘các nhà khoa học AI thực thụ’ có khả năng cải tiến thí nghiệm và giải quyết các vấn đề khoa học.

South China Morning Post ngày 10.3 đưa tin theo một bài báo đăng trên tạp chí Cell Press Nexus hôm 8.3, các mô hình học sâu đã cách mạng hóa lĩnh vực nghiên cứu khoa học nhờ khả năng khám phá các mối quan hệ từ một lượng lớn dữ liệu.

Điển hình, Sora (thuộc công ty OpenAI, Mỹ) – một công cụ chuyển văn bản thành video một cách chân thực, là bước tiến lớn cho trí tuệ nhân tạo tạo sinh (Gen AI). Nó không chỉ hiểu những gì người dùng yêu cầu trong văn bản mà còn hiểu vật thể tồn tại như thế nào ở thế giới thực.

Tuy nhiên, công ty OpenAI thừa nhận rằng Sora cũng gặp nhiều khó khăn trong việc mô phỏng một số khía cạnh của thế giới thực và không thể “mô hình hóa” chính xác tính chất vật lý của nhiều tương tác cơ bản, ví dụ như kính vỡ. Sora được đào tạo bằng cách sử dụng lượng lớn dữ liệu hình ảnh, cho phép nó chọn các mẫu để tạo ra hình ảnh và video mô phỏng thực tế. Tuy nhiên, nó không được đào tạo để hiểu các định luật vật lý như trọng lực.

“Nếu không có hiểu biết căn bản về thế giới, một mô hình về cơ bản chỉ là hoạt ảnh thay vì mô phỏng”, tác giả nghiên cứu và giáo sư tại Viện Công nghệ Phương Đông (Trung Quốc) Trần Vận Điền nhận xét.
Theo bài báo trên Cell Press Nexus, các mô hình học sâu thường được đào tạo bằng cách sử dụng dữ liệu chứ không phải kiến thức có sẵn, có thể bao gồm những thứ như định luật vật lý hoặc logic toán học. Ngược lại, theo các nhà khoa học từ Đại học Bắc Kinh và EIT, trong quá trình đào tạo các công cụ, kiến thức có sẵn có thể tích hợp với dữ liệu để tăng độ chính xác, từ đó tạo ra các mô hình “máy học thông tin” có khả năng đưa lượng kiến thức này vào đầu ra của chúng.

Nhóm nghiên cứu viết rằng, việc quyết định tích hợp kiến thức có sẵn (như mối quan hệ chức năng, phương trình và logic) vào một mô hình để học trước là một thách thức. Thậm chí, việc kết hợp nhiều quy tắc cũng có thể dẫn đến việc các mô hình bị phá huỷ.

“Khi phải đối mặt với một lượng lớn kiến thức và quy tắc – điều thường hay xảy ra, các mô hình máy học thông tin hiện tại có xu hướng gặp khó khăn hoặc thậm chí thất bại”, ông Trần cho hay.

Để giải quyết vấn đề này, các nhà nghiên cứu đã tạo ra một khuôn khổ để đánh giá giá trị của các quy tắc và xác định sự kết hợp nào dẫn đến các mô hình có tính dự đoán cao nhất.

“Việc đưa kiến thức của con người vào các mô hình AI có thể cải thiện hiệu quả và suy luận của chúng, nhưng câu hỏi đặt ra là làm thế nào để cân bằng giữa ảnh hưởng của dữ liệu và kiến thức”.”Khuôn khổ của chúng tôi có thể được sử dụng để đánh giá các kiến thức và quy tắc khác nhau nhằm nâng cao khả năng dự đoán của các mô hình học sâu”, tác giả và nhà nghiên cứu tại Đại học Bắc Kinh Từ Hạo cho hay.

Theo bài báo, khuôn khổ này tính toán “tầm quan trọng của quy tắc”, xem xét 1 quy tắc cụ thể hoặc sự kết hợp các quy tắc ảnh hưởng như thế nào đến độ chính xác dự đoán của một mô hình.

Ông Trần cho rằng việc dạy các mô hình AI về những quy luật như vậy (chẳng hạn như các định luật vật lý) có thể giúp chúng phản ánh thế giới thực nhiều hơn. Điều này sẽ khiến chúng trở nên hữu ích hơn trong khoa học và kỹ thuật.

Nhóm nghiên cứu cũng thử nghiệm khuôn khổ của họ bằng cách sử dụng nó để tối ưu hóa 1 mô hình giải các phương trình đa biến và 1 mô hình khác dùng để dự đoán kết quả của một thí nghiệm hóa học.

Ông Trần nói rằng trong ngắn hạn, khuôn khổ này sẽ hữu ích nhất trong các mô hình khoa học, trong đó tính nhất quán giữa mô hình và các quy luật vật lý là rất quan trọng để tránh những hậu quả nguy hại tiềm ẩn.

Nhóm nghiên cứu hy vọng sẽ phát triển khuôn khổ của mình hơn nữa để cho phép AI xác định kiến thức và quy tắc trực tiếp từ dữ liệu mà không cần sự can thiệp của con người.

Ông Trần chia sẻ: “Chúng tôi muốn biến nó thành một vòng khép kín bằng cách biến mô hình này thành một nhà khoa học AI thực sự”. Nhóm đang phát triển một công cụ mã nguồn mở dành cho các nhà phát triển AI có thể cho phép họ đạt được điều này.

Tuy nhiên, nhóm đã xác định được ít nhất một vấn đề. Trong quá trình nghiên cứu, nhóm phát hiện ra rằng khi thêm nhiều dữ liệu vào mô hình, các quy tắc chung sẽ trở nên quan trọng hơn các quy tắc cụ thể, điều này không giúp ích gì trong các lĩnh vực như sinh học và hóa học vì chúng “thường thiếu các quy tắc chung có sẵn giống như điều chỉnh các phương trình”.

RELATED ARTICLES

Tin mới