Tác giả : Ewen Callaway
Giải thưởng năm nay vinh danh những công cụ tính toán giúp thay đổi ngành công nghệ sinh học và có tiềm năng cách mạng hóa việc khám phá dược phẩm.
Lần đầu tiên – và có lẽ không phải là lần cuối cùng – một đột phá khoa học được thúc đẩy bởi Trí tuệ Nhân tạo (AI) đã được công nhận bằng giải Nobel. Giải Nobel Hóa học năm 2024 đã được trao cho John Jumper và Demis Hassabis tại Google DeepMind ở London , vì phát triển một công cụ AI có tính đột phá để dự đoán cấu trúc protein có tên là AlphaFold, cùng với David Baker tại Đại học Washington ở Seattle, vì những đóng góp của ông vào lĩnh vực thiết kế protein tính toán, một lĩnh vực đã được AI hỗ trợ trong những năm gần đây.
“Tôi hy vọng khi chúng ta nhìn lại AlphaFold, nó sẽ là bằng chứng đầu tiên về tiềm năng đáng kinh ngạc của AI trong việc thúc đẩy khám phá khoa học.” Hassabis nói trong buổi họp báo tại DeepMind vào ngày 9 tháng 10. “ Điều đó thật không thể tin được vào thời điểm này” .
Tác động của AlphaFold, được công bố chỉ vài năm trước, thật sự mang tính cách mạng. Công cụ này đã giúp các nhà nghiên cứu có thể truy cập vào các cấu trúc protein – thường là, nhưng không phải lúc nào cũng có độ chính xác cao – cho các nhà nghiên cứu chỉ với một cú nhấp chuột, và mở ra những thí nghiệm mà một thập kỷ trước không thể tưởng tượng được. “Đây là một cuộc cách mạng lớn.” , Christine Orengo, một nhà sinh học tính toán tại Đại học London, người đã sử dụng các cấu trúc do AlphaFold dự đoán để phát hiện ra các protein mới, cho biết.
“Việc dự đoán cấu trúc ba chiều của protein chỉ từ chuỗi amino acid của chúng từ rất lâu đã là một giấc mơ. Trong nhiều thập kỷ, điều này được coi là bất khả thi,” Chủ tịch Ủy ban Nobel Heiner Linke, một nhà nghiên cứu khoa học nano tại Đại học Lund ở Thụy Điển, phát biểu trong lễ công bố giải thưởng. Ông cho biết thêm những người đoạt giải thưởng năm nay “đã giải mã được bí ẩn này.” Ba người đoạt giải sẽ chia sẻ tổng số tiền thưởng trị giá 11 triệu krona Thụy Điển (tương đương 1 triệu USD).
CÔNG CỤ AI ĐẠT GIẢI THƯỞNG
DeepMind ra mắt AlphaFold lần đầu vào năm 2018, khi nó giành chiến thắng trong cuộc thi dự đoán cấu trúc protein được tổ chức hai năm một lần mang tên Critical Assessment of Protein Structure Prediction (CASP) (Đánh giá Quan trọng về Dự đoán Cấu trúc Protein). Tuy nhiên, phiên bản thứ hai của mạng lưới học sâu này, được công bố vào cuối năm 2020, mới thực sự gây chấn động trong giới khoa học sinh học. Nhiều dự đoán của AlphaFold2 tại CASP chính xác đến mức không thể phân biệt được với các cấu trúc protein đã được giải bằng thực nghiệm.
Hassabis, đồng sáng lập và giám đốc điều hành của DeepMind, và Jumper, trưởng nhóm AlphaFold, đã dẫn dắt quá trình phát triển AlphaFold2. Để dự đoán cấu trúc protein, mạng lưới thần kinh này sử dụng dữ liệu từ các thư viện có hàng trăm nghìn cấu trúc và hàng triệu chuỗi của các protein liên quan – những dữ liệu này chứa thông tin về hình dạng của chúng.
AlphaFold thành công chủ yếu nhờ vào Protein Data Bank (Ngân hàng Dữ liệu Protein), một kho dữ liệu miễn phí chứa hơn 200.000 cấu trúc protein đã được xác định bằng các phương pháp như nhiễu xạ tia X và kính hiển vi điện tử lạnh. “Thật là khiêm nhường khi chúng tôi đào tạo [ AlphaFold ] sau nhiều năm nỗ lực . Mỗi điểm dữ liệu là cả một quá trình nỗ lực của ai đó,” Jumper phát biểu trong buổi họp báo của DeepMind.
Năm 2021, DeepMind đã công khai mã nguồn của AlphaFold2 cùng với dữ liệu cần thiết để đào tạo mô hình. Một cơ sở dữ liệu của AlphaFold, được tạo ra cùng Viện Tin học Sinh học Châu Âu của Phòng thí nghiệm Sinh học Phân tử Châu Âu (EMBL) ở Hinxton, Vương quốc Anh, hiện nắm giữ cấu trúc của gần như tất cả các protein từ mọi sinh vật có trong các cơ sở dữ liệu di truyền, với tổng cộng khoảng 214 triệu dự đoán. Năm nay, công ty đã công bố phiên bản thứ ba của AlphaFold, vốn có thể mô phỏng các phân tử khác — những phân tử tương tác với protein, chẳng hạn như dược phẩm.
Cuộc cách mạng mà Jumper, Hassabis và các đồng nghiệp của họ tạo ra vẫn đang trong giai đoạn đầu và tác động đầy đủ của AlphaFold đối với khoa học có thể phải mất nhiều năm nữa mới được biết đến. Hiện tại, công cụ này đang giúp các nhà khoa học khám phá những kiến thức mới.
Một nhóm tiên phong đã sử dụng AlphaFold cùng với dữ liệu thực nghiệm để lập bản đồ tổ hợp lỗ hạt nhân, một trong những cỗ máy lớn nhất của tế bào chúng ta giúp vận chuyển phân tử vào và ra khỏi nhân. Năm ngoái, hai nhóm nghiên cứu đã khai thác toàn bộ cơ sở dữ liệu AlphaFold để khám phá những vùng bí ẩn nhất trong vũ trụ protein, xác định các họ protein mới và tìm ra những kết nối bất ngờ trong cơ chế của sự sống.
Nhiều nhà nghiên cứu hy vọng AlphaFold và các công cụ AI khác mà nó truyền cảm hứng sẽ thay đổi y học, nhưng hiện vẫn chưa rõ liệu AlphaFold có giúp giảm bớt chi phí và rút ngắn quá trình phát triển các loại thuốc an toàn hay không. Các nhà khoa học đang đặt nền móng cho các loại vắc-xin mới nhận thấy AlphaFold vô cùng hữu ích và trong một số trường hợp, là yếu tố thay đổi cuộc chơi. Nhưng AlphaFold là sự bổ sung cho các nghiên cứu thử nghiệm và các phương pháp tiếp cận khác để lập bản đồ và điều chỉnh cấu trúc protein của vi-rút để dùng cho vắc-xin.
Đối với hầu hết các nhà nghiên cứu, một cấu trúc dự đoán là điểm khởi đầu của một nghiên cứu, chứ không phải là kết thúc, Jan Kosinski, một nhà mô hình hóa cấu trúc tại Phòng thí nghiệm Sinh học Phân tử Châu Âu (EMBL) ở Hamburg, Đức cho biết. “Lúc đầu, có nỗi sợ rằng nó sẽ thay thế sinh học cấu trúc, khiến mọi người mất việc, v.v. Nhưng thực tế lại hoàn toàn ngược lại”, ông nói thêm.
David Jones, một nhà tin sinh học tại Đại học London, người đã hợp tác với DeepMind trong phiên bản đầu tiên của AlphaFold từ năm 2016, cho biết một trong những tác động lớn nhất của công cụ này là thay đổi tư duy của các nhà sinh học, “khiến họ nhận thấy rằng máy tính có thể tạo ra những giả thuyết hữu ích để kiểm tra trong phòng thí nghiệm.”
TẠO RA PROTEINS MỚI
Hơn hai thập kỷ trước khi DeepMind bắt đầu phát triển tại AlphaFold, nhà vật lý sinh học tính toán David Baker và các cộng sự của ông đã phát triển một công cụ phần mềm được gọi là Rosetta dùng để mô phỏng cấu trúc protein dựa trên các nguyên lý vật lý. Công cụ này so sánh các đoạn nhỏ của nhiều cấu trúc và chuỗi protein đã có để xác định chuỗi protein nào có thể gấp thành một hình dạng cụ thể.
Ban đầu, Rosetta được áp dụng để dự đoán cấu trúc protein – và đã nằm trong số những ứng dụng hàng đầu tại các cuộc thi dự đoán cấu trúc protein được tổ chức hai năm một lần (CASP), trước khi AlphaFold chiếm ưu thế. Nhưng Baker nhanh chóng nhận ra rằng mô hình này có thể được xoay vòng để thiết kế các protein hoàn toàn mới.
Công cụ này đã thành công bước đầu trong việc thiết kế các protein mới, bao gồm các enzyme mới, protein có khả năng liên kết chặt chẽ với các phân tử khác, và các hạt nano protein tự lắp ráp giống như vi-rút (một trong số đó đã trở thành cơ sở cho vắc-xin COVID-19 được phê duyệt).
Khi AlphaFold2 được công bố – nhưng chưa được phát hành – Baker và nhóm của ông, bao gồm nhà hóa học tính toán Minkyung Baek, hiện tại đang làm việc ở Đại học Quốc gia Seoul, Hàn Quốc, đã bắt tay vào việc nghiên cứu phần mềm và áp dụng một số thủ thuật của nó vào phiên bản dựa trên AI trước đây của Rosetta. Phiên bản đầu tiên của mạng RoseTTAFold đạt hiệu suất gần như ngang ngửa với AlphaFold2. Kể từ năm 2021, cả hai mạng đều được các nhà phát triển của chúng và các nhà khoa học khác liên tục cải tiến để giải quyết những thách thức mới, chẳng hạn như dự đoán cấu trúc của các tổ hợp protein tương tác với nhau.
Nhóm của Baker đặc biệt nổi tiếng trong việc ứng dụng học máy vào mục tiêu của phòng thí nghiệm: tạo ra những protein chưa từng thấy trong tự nhiên. Một công cụ vừa mới được phát triển bởi nhóm của Baker là kết hợp RoseTTAFold với mạng nơ-ron khuếch tán tạo hình ảnh đã dẫn đến một sự thay đổi lớn trong khả năng thiết kế protein của các nhà nghiên cứu.
TIẾN BỘ NHANH CHÓNG
Sergey Ovchinnikov, một nhà sinh học tiến hóa tại Viện Công nghệ Massachusetts ở Cambridge, người lấy bằng tiến sĩ tại phòng thí nghiệm của Baker, cho biết những công cụ như vậy là một cỗ máy tăng tốc mạnh mẽ và có tính dân chủ. Trước đây, Rosetta phải mất nhiều tuần chạy trên hàng trăm bộ xử lý để đưa ra thiết kế protein, một nhiệm vụ mà các công cụ dựa trên AI mới hơn có thể hoàn thành trong vài giây. Ông nói rằng “Bây giờ mọi người trên thế giới đều có thể thiết kế protein”.
“Đã có rất nhiều điều truyền cảm hứng cho tôi từ những người khác trong lĩnh vực này và những người mà tôi đã làm việc cùng,” Baker nói qua điện thoại trong buổi công bố giải Nobel. “Tôi đã đứng trên vai của những người khổng lồ.”
Martin Steinegger, một nhà sinh học tính toán tại Đại học Quốc gia Seoul ở Hàn Quốc, so sánh tác động của AlphaFold, RoseTTAFold và các công cụ AI sinh học khác với những gì mà các sứ mệnh Apollo lên Mặt Trăng đã đạt được, nó thể hiện điều mà kỹ thuật có thể làm được. “Đây là một khoảnh khắc tương tự cho việc dự đoán cấu trúc và lĩnh vực sinh học cấu trúc — chỉ cần nhìn thấy những gì có thể xảy ra,” ông nói.
Ít người ngạc nhiên với quyết định của Ủy ban Nobel. Đối với Baker, “hầu hết mọi người đều nghĩ rằng đây là một tình huống ‘không phải là nếu mà là khi nào’, dựa trên khối lượng công việc mà ông đã làm trong lĩnh vực này,” Jones cho biết. Jumper, nhận thức rằng ông và Hassabis nằm trong danh sách rút gọn của nhiều người, đã nói trong buổi họp báo rằng ông không thể ngủ được vào đêm trước khi thông báo hôm nay diễn ra.
Đối với Jumper, các cấu trúc dự đoán mà AlphaFold cung cấp tạo ra những cơ hội mới cho khám phá khoa học. Hàng triệu nhà khoa học đã sử dụng các công cụ này, và ông hy vọng sẽ không lâu nữa có một trong số họ nhận được cuộc gọi từ Thụy Điển. “Khoảnh khắc mà tôi sẽ gần như hào hứng như thế này sẽ là Giải Nobel nói về những công việc đã được thực hiện bởi AlphaFold,” ông nói.
Nguồn: Ewen Callaway, “Chemistry Nobel goes to developers of AlphaFold AI that predicts protein structures”, Nature, 9/10/2024
Biên dịch: Phong trào Duy Tân