Đến lượt AI của Elon Musk tích hợp tính năng nhìn, nghe, nói như con người

Grok, chatbot AI do xAI - công ty của Elon Musk phát triển - đang trong quá trình được tích hợp khả năng xử lý thông tin đa phương tiện, cho phép người dùng tương tác bằng cả hình ảnh và văn bản.

Grok - sản phẩm trí tuệ nhân tạo (AI) đến từ xAI - công ty do Elon Musk sáng lập, được kỳ vọng sẽ sớm được nâng cấp với khả năng tiếp nhận thông tin đa phương tiện. Thông tin này được hé lộ thông qua tài liệu dành cho nhà phát triển được xAI công bố.


 Grok được đánh giá là “tân binh” trong lĩnh vực AI.

Vào tháng 3/2024, Grok đã có bước tiến đáng kể với phiên bản Grok 1.5, sở hữu khả năng lập luận được cải thiện đáng kể. Trước đó, trong một bài đăng trên blog vào tháng trước, xAI từng úp mở về việc Grok-1.5V sẽ cung cấp "các mô hình đa phương thức trong một số lĩnh vực nhất định". Bản cập nhật tài liệu dành cho nhà phát triển gần đây dường như cho thấy xAI đang chuẩn bị cho ra mắt một mô hình AI mới. Điều này đồng nghĩa với việc người dùng có thể tải ảnh lên Grok và nhận được câu trả lời bằng văn bản. Cụ thể, tài liệu hướng dẫn cách thức các nhà phát triển có thể sử dụng bộ công cụ phát triển phần mềm (SDK) của xAI để tạo ra phản hồi dựa trên cả văn bản và hình ảnh. Kịch bản Python mẫu minh họa cách đọc tệp hình ảnh, thiết lập lời nhắc văn bản và sử dụng xAI SDK để tạo phản hồi.

Ra mắt vào tháng 11/2023 và chỉ dành riêng cho người dùng trả phí X Premium Plus, Grok được đánh giá là “tân binh” trong lĩnh vực AI so với các đối thủ nặng ký như ChatGPT của OpenAI. Điểm đặc biệt của Grok là khả năng tiếp cận thông tin theo thời gian thực, bao gồm cả các bài đăng trên nền tảng X. Theo thông tin từ xAI, mô hình Grok được huấn luyện dựa trên "nhiều nguồn dữ liệu văn bản công khai trên Internet tính đến quý 3 năm 2023 và tập dữ liệu do người đánh giá xem xét và tuyển chọn".

Bài đăng trên blog của X cũng khẳng định Grok-1 không được huấn luyện trên dữ liệu X (bao gồm cả các bài đăng X công khai). Tuy nhiên, xAI cũng thừa nhận rằng các điểm chuẩn cho mô hình ngôn ngữ lớn thường bị chỉ trích vì các mô hình có thể hoạt động tốt trên điểm chuẩn nếu các điểm chuẩn đó được đưa vào dữ liệu đào tạo của chúng. Điều này giống như việc ghi nhớ câu trả lời trong bài kiểm tra, thay vì thực sự hiểu nội dung.

Mặc dù vậy, theo một bài đăng trên blog của xAI, Grok 1.5 đang dần thu hẹp khoảng cách với GPT-4 trên nhiều tiêu chuẩn đánh giá, từ cấp tiểu học đến các cuộc thi cấp trung học. Chatbot đa phương thức được xem là đích đến tiếp theo của cuộc đua AI. Nhiều ông lớn trong ngành như Google đã công bố những bước tiến mới tại sự kiện Google I/O, trong khi OpenAI cũng trình làng GPT-4o. Việc thiếu hụt khả năng đa phương tiện đã khiến Grok bị tụt lại phía sau cho đến thời điểm hiện tại. Liệu với những nỗ lực nâng cấp, Grok có thể tạo nên bất ngờ trong cuộc đua đầy thử thách này?

Loading...
TIN CŨ HƠN

"Trí tuệ nhân tạo" AlphaGo là gì mà khiến con người thán phục?

AlphaGo là gì? Tại sao AlphaGo lại được nhiều người quan tâm như vậy? Điều gì đã khiến cho bộ máy nhân tạo AlphaGo chiến thắng một kiện tướng cờ vây nhiều năm kinh nghiệm?

Đăng ngày: 29/06/2025
Những ứng dụng thiết thực của AI trong cuộc sống

Những ứng dụng thiết thực của AI trong cuộc sống

Không chỉ tạo ra cơn sốt về công nghệ, AI còn đặt viên gạch đầu tiên cho một kỷ nguyên máy móc, từng bước thay thế con người thực hiện những công việc từ đơn giản cho tới không tưởng.

Đăng ngày: 25/06/2025
Các nhân vật trong truyện tranh Conan sẽ có dung nhan thực tế như thế nào ngoài đời thật?

Các nhân vật trong truyện tranh Conan sẽ có dung nhan thực tế như thế nào ngoài đời thật?

Công nghệ AI cho kết quả siêu ấn tượng khi dựng lại hình ảnh các nhân vật trong bộ truyện Thám Tử Lừng Danh Conan.

Đăng ngày: 21/06/2025
Kỹ sư NASA bất ngờ trước hình dạng “ngoài hành tinh” của linh kiện tàu vũ trụ do AI chế tạo

Kỹ sư NASA bất ngờ trước hình dạng “ngoài hành tinh” của linh kiện tàu vũ trụ do AI chế tạo

Theo lời các kỹ sư NASA, vẻ ngoài khác lạ không ảnh hưởng tới hiệu năng của chúng. Trái lại, nó còn hiệu quả hơn thiết kế do con người tạo ra.

Đăng ngày: 11/06/2025
Dùng AI vẽ lại khuôn mặt của các nhân vật nổi tiếng trên khắp thế giới

Dùng AI vẽ lại khuôn mặt của các nhân vật nổi tiếng trên khắp thế giới

Các mỹ nhân nổi tiếng như Dương Quý Phi và Võ Tắc Thiên sau khi được AI phục dựng tướng mạo trông sẽ như thế nào?

Đăng ngày: 10/06/2025
Trí tuệ nhân tạo là gì? AI (artificial intelligence) là gì?

Trí tuệ nhân tạo là gì? AI (artificial intelligence) là gì?

Định nghĩa trí tuệ nhân tạo: (AI: Artificial Intelligence) có thể được định nghĩa như một ngành của khoa học máy tính liên quan đến việc tự động hóa các hành vi thông minh.

Đăng ngày: 08/06/2025
OpenAI ra mắt Chat GPT-4o với trí thông minh

OpenAI ra mắt Chat GPT-4o với trí thông minh "tiệm cận con người", miễn phí 100%

Công ty trí tuệ nhân tạo hàng đầu thế giới OpenAI vừa tổ chức sự kiện công bố mô hình AI mới có tên GPT-4o.

Đăng ngày: 04/06/2025
Tiêu điểm
Khoa Học News