Tiến sĩ Việt tại Google dùng AI chuyển văn bản thành ảnh

TS Lương Minh Thắng cùng 10 chuyên gia tại Google Brain xây dựng mô hình Parti, dạy cho trí tuệ nhân tạo có thể vẽ tranh dựa trên từ ngữ mô tả.

TS Thắng (34 tuổi), là người Việt duy nhất trong nhóm nghiên cứu chủ chốt về mô hình Parti (Pathways Autoregressive Text-to-Image) - tự chuyển văn bản thành hình ảnh tại Google Brain đầu năm 2021. Ngôn ngữ thường dùng trong giao tiếp của con người, nhưng "nếu ứng dụng công nghệ để tạo ra các bức ảnh, tranh sáng tạo thì có thể coi là bước tiến mới của AI", TS Thắng nói.

Tiến sĩ Việt tại Google dùng AI chuyển văn bản thành ảnh
TS Lương Minh Thắng hiện làm việc cho Google Brain chuyên phát triển các sản phẩm AI. (Ảnh: NVCC).

Anh chia sẻ, các mô hình AI hiện nay ứng dụng trong ngôn ngữ thông qua mô hình chatbot có thể tương tác với con người bằng văn bản. Còn trong lĩnh vực hình ảnh, AI có thể nhận diện các vật thể trong ảnh. "Nếu kết hợp hai thứ này để chuyển hóa từ ngôn ngữ dạng văn bản thành hình ảnh sẽ tạo ra một mô hình AI rất hiện đại, hỗ trợ đắc lực cho con người trong lĩnh vực sáng tạo hình ảnh", TS Thắng nói về lý do làm mô hình Parti.

Mô hình Parti cho phép tạo hình ảnh đúng như mô tả và mong muốn của người dùng. Công nghệ này có thể hỗ trợ những người chuyên làm công việc sáng tạo hình ảnh như nghệ sĩ, nhiếp ảnh gia, nhà thiết kế thời trang, đồ họa... Khi họ có ý tưởng về một bức ảnh, chỉ cần viết các chi tiết mong muốn, AI sẽ phân tích và cho ra bức ảnh gợi ý cho ý tưởng đó giúp họ tăng khả năng sáng tạo. Chỉ cần thay đổi một câu, từ, hay chi tiết trong văn bản có thể cho ra bức ảnh khác nhau.

Tiến sĩ Việt tại Google dùng AI chuyển văn bản thành ảnh
Những bức ảnh do AI tạo ra dựa trên các mô tả bằng ngôn ngữ dưới dạng văn bản phía dưới. (Ảnh chụp màn hình)

Để tạo ra mô hình Parti, TS Thắng và các chuyên gia Google sử dụng hàng trăm triệu cặp dữ liệu văn bản - hình ảnh tương ứng, huấn luyện cho mô hình AI. Dữ liệu được sử dụng từ các website, xử lý bằng mạng nơ-ron nhân tạo có dung lượng khoảng 20 tỷ nơ-ron. "Dựa trên những dữ liệu văn bản và hình ảnh, AI sẽ kết hợp lại để tạo ra một bức ảnh mới, giúp con người có những ý tưởng mới", TS Thắng chia sẻ.

Các chủ đề được mô hình Parti thể hiện nhiều nhất về thiên nhiên, động vật, đồ vật... Trên website của Google Reseach giới thiệu nhiều hình ảnh được tạo từ AI như ảnh thật.

Theo nhóm nghiên cứu, với những hình ảnh liên quan đến con người được nhóm xử lý cẩn trọng dựa trên nguyên tắc không gây ảnh hưởng tiêu cực đến cộng đồng về giới tính, sắc tộc, tôn giáo...

Tiến sĩ Việt tại Google dùng AI chuyển văn bản thành ảnh
Những bức tranh sơn dầu theo phong cách họa sĩ nổi tiếng Van Gogh do AI thực hiện. (Ảnh chụp màn hình).

Nhược điểm hiện nay là với những văn bản quá dài, mô tả quá nhiều chi tiết, hay mô tả những hình ảnh có tính xung đột (như biển đặt cạnh sa mạc) thì AI có thể hiểu sai hoặc không cho ra kết quả.

TS Thắng cho biết, thời gian tới nhóm sẽ khắc phục hạn chế này để xây dựng mô hình AI hoàn thiện. Nhóm tính tới huấn luyện AI có thể chỉnh sửa hình ảnh theo yêu cầu trên văn bản của người dùng để phục vụ họ tốt hơn cũng như nghiên cứu tạo video từ nhiều tấm ảnh có nội dung tương tự nhau.

Lương Minh Thắng từng là học sinh chuyên Toán trường phổ thông Năng khiếu Đại học Quốc gia TP HCM. Sau khi tốt nghiệp cấp 3, anh học ngành khoa học máy tính tại Đại học Quốc gia Singapore. Năm 2011, anh nhận học bổng tiến sĩ tại Đại học Stanford (Mỹ). Tháng 9/2016, anh làm việc chính thức tại Google Brain với chuyên môn nghiên cứu về máy học, xử lý ngôn ngữ tự nhiên.
Từ khóa liên quan:
Loading...
TIN CŨ HƠN
Người phụ nữ làm công việc đặc biệt: Ngăn chặn động vật

Người phụ nữ làm công việc đặc biệt: Ngăn chặn động vật "đi lạc" và những chuyện thú vị trong nghề

Công việc của cô tưởng chừng như đơn giản nhưng trên thực tế nó đòi hỏi rất nhiều thứ, chứa đựng vô số rủi ro.

Đăng ngày: 23/08/2022
Người phụ nữ làm công việc đặc biệt: Ngăn chặn động vật

Người phụ nữ làm công việc đặc biệt: Ngăn chặn động vật "đi lạc" những chuyện thú vị trong nghề

Công việc của cô tưởng chừng như đơn giản nhưng trên thực tế nó đòi hỏi rất nhiều thứ, chứa đựng vô số rủi ro.

Đăng ngày: 23/08/2022
Nữ khoa học gia Việt Nam truy tìm bí ẩn gene người

Nữ khoa học gia Việt Nam truy tìm bí ẩn gene người

TS Bùi Thanh Duyên giải mã thành công hơn 100.000 mã gene phát hiện sớm nguy cơ bệnh di truyền, giúp nhiều người có kế hoạch theo dõi, tầm soát phù hợp.

Đăng ngày: 18/08/2022
Nữ phi hành gia đầu tiên bay vào vũ trụ và chuyến hành trình nghẹt thở suýt không được trở về Trái đất

Nữ phi hành gia đầu tiên bay vào vũ trụ và chuyến hành trình nghẹt thở suýt không được trở về Trái đất

Nữ phi hành gia người Nga Valentina Tereshkova đã ghi tên mình vào lịch sử khi bay ra ngoài vũ trụ vào năm 1963.

Đăng ngày: 15/08/2022
Thor Heyerdahl và chuyến phiêu lưu hoang dã vượt đại dương bằng thuyền tự chế

Thor Heyerdahl và chuyến phiêu lưu hoang dã vượt đại dương bằng thuyền tự chế

Nhà dân tộc học người Na Uy Thor Heyerdahl đã chế tạo một chiếc bè từ các khúc gỗ balsa và dây gai dầu, thành công vượt qua Thái Bình Dương vào năm 1947.

Đăng ngày: 11/08/2022
Câu chuyện về nhà sưu tập sách

Câu chuyện về nhà sưu tập sách "ám ảnh" nhất thế giới

Thomas Phillipps được biết đến không chỉ là một nhà sưu tập sách và cổ vật người Anh, ông còn là một nhà thư tịch thực thụ, sở hữu bộ sưu tập sách và bản thảo lớn nhất của thế kỷ 19.

Đăng ngày: 09/08/2022
Nhà thiên văn học thế kỷ 17 thiết kế xe bay tới Mặt trăng

Nhà thiên văn học thế kỷ 17 thiết kế xe bay tới Mặt trăng

Nhà khoa học John Wilkins là người đầu tiên đề xuất nhiệm vụ có người lái tới Mặt trăng và ông từng thiết kế một cỗ xe có cánh để hoàn thành mục tiêu.

Đăng ngày: 09/08/2022
Tiêu điểm
Khoa Học News