Trí tuệ nhân tạo giải mã bản ghi chép cổ đại

Thư viện Tu viện St. Gall ở Thụy Sĩ là nơi lưu giữ khoảng 160.000 tập bản thảo văn học và lịch sử có niên đại từ thế kỷ thứ 8.

Tất cả đều được viết tay trên giấy da và bằng những ngôn ngữ hiếm khi được sử dụng trong thời hiện đại.

Để lưu giữ những “báu vật lịch sử” này của nhân loại, hàng triệu văn bản như vậy đã được cất trong các thư viện và tu viện trên khắp thế giới. Phần lớn bộ sưu tập được chia sẻ tới công chúng thông qua hình ảnh kỹ thuật số. Tuy nhiên, các chuyên gia cho rằng, có một lượng tài liệu “phi thường” chưa từng được đọc, được viết bằng ngôn ngữ cổ.

Trí tuệ nhân tạo giải mã bản ghi chép cổ đại
Hệ thống tự động hóa phiên âm trang sách.

Loading...

Giờ đây, các nhà nghiên cứu tại Đại học Notre Dame đang phát triển một mạng lưới thần kinh nhân tạo để đọc các chữ viết tay cổ phức tạp dựa trên nhận thức của con người. Walter Scheirer - Phó Giáo sư Khoa Khoa học và Kỹ thuật Máy tính tại Notre Dame, chia sẻ:

“Chúng tôi đang xử lý các tài liệu lịch sử có từ nhiều thế kỷ trước và bằng các ngôn ngữ như tiếng Latinh, hiếm khi được sử dụng ở hiện tại. Những gì chúng tôi đặt ra là tự động hóa phiên âm của trang sách, theo cách bắt chước nhận thức thông qua con mắt của người đọc chuyên nghiệp. Đồng thời, cung cấp khả năng đọc văn bản nhanh chóng, có thể tìm kiếm được”.

Trong nghiên cứu mới được công bố, Scheirer phác thảo cách nhóm của ông kết hợp các phương pháp học máy truyền thống với tâm sinh lý trực quan. Đây là một phương pháp đo lường mối liên hệ giữa các kích thích vật lý và hiện tượng tinh thần.

Ví dụ như khoảng thời gian cần thiết để một người đọc chuyên nghiệp nhận ra một ký tự cụ thể, đánh giá chất lượng của chữ viết tay hoặc xác định việc sử dụng các chữ viết tắt nhất định.

Nhóm của Scheirer đã nghiên cứu các bản viết tay bằng tiếng Latinh được số hóa. Bản này được viết bởi những người ghi chép ở Tu viện St. Gall vào thế kỷ thứ 9. Độc giả đã nhập các phiên âm thủ công của họ vào một giao diện phần mềm được thiết kế đặc biệt.

Sau đó, nhóm nghiên cứu đo thời gian phản ứng trong quá trình phiên âm để biết từ, ký tự và đoạn văn nào dễ hay khó. Ông Scheirer giải thích, phương pháp đó đã tạo ra một mạng lưới phù hợp hơn với hành vi của con người. Nhờ đó, giảm lỗi và cung cấp khả năng đọc văn bản chính xác, thực tế hơn.

“Đó là một chiến lược thường không được sử dụng trong học máy. Chúng tôi gắn nhãn dữ liệu thông qua các phép đo tâm sinh lý này. Chúng xuất phát trực tiếp từ các nghiên cứu tâm lý về nhận thức, bằng cách thực hiện các phép đo hành vi.

Sau đó, chúng tôi thông báo cho mạng lưới những khó khăn phổ biến và có thể sửa chữa dựa trên các phép đo đó”, ông Scheirer giải thích.

Tuy nhiên, theo Phó Giáo sư Scheirer, phương pháp này vẫn gặp nhiều thách thức. Nhóm của ông đang làm việc để cải thiện độ chính xác của các bản chép, đặc biệt là trong trường hợp tài liệu bị hỏng hoặc không đầy đủ. Đồng thời, tính toán các khía cạnh khác khi trang ghi chép có thể khiến hệ thống nhầm lẫn.

Tín hiệu đáng mừng là nhóm đã thành công điều chỉnh chương trình để phiên âm các văn bản tiếng Ethiopia. Sau đó, điều chỉnh nó sang một ngôn ngữ có bộ ký tự hoàn toàn khác. Đây được cho là bước đầu tiên để phát triển một chương trình có khả năng phiên âm và dịch thông tin cho người dùng.

Từ khóa liên quan:
Loading...
TIN CŨ HƠN
Công nghệ AI giúp rút ngắn tốc độ điều chế vaccine đáng kinh ngạc

Công nghệ AI giúp rút ngắn tốc độ điều chế vaccine đáng kinh ngạc

Công nghệ trí thông minh nhân tạo (AI) đang làm thay đổi toàn bộ ngành công nghiệp dược phẩm.

Đăng ngày: 03/08/2021
Công nghệ tìm kiếm xác tàu đắm bằng AI

Công nghệ tìm kiếm xác tàu đắm bằng AI

Giờ đây, các nhà khoa học có thể sử dụng công nghệ AI để phát hiện các điểm khảo cổ trên cạn cũng như dưới nước.

Đăng ngày: 28/07/2021
Có bãi cỏ đẹp mà bị người ta dẫm hoài, anh chàng làm luôn vòi nước AI xịt cho bõ ghét

Có bãi cỏ đẹp mà bị người ta dẫm hoài, anh chàng làm luôn vòi nước AI xịt cho bõ ghét

Trồng thảm cỏ là một quá trình tinh vi đòi hỏi phải chăm chỉ tưới nước và ngăn không cho người ta dẫm đạp lên bãi cỏ của bạn cả ngày.

Đăng ngày: 22/07/2021
Công nghệ AI giúp đo mức mỡ màng ngoài tim

Công nghệ AI giúp đo mức mỡ màng ngoài tim

Tích tụ chất béo xung quanh tim là một trong những nguyên nhân gây bệnh tim mạch và hội chứng chuyển hóa.

Đăng ngày: 13/07/2021
Giả thuyết kinh dị của tỷ phú Elon Musk về siêu AI

Giả thuyết kinh dị của tỷ phú Elon Musk về siêu AI

Vị tỷ phú cá tính này cho rằng con người sẽ tạo ra loại AI " siêu phàm" sau khi não bị nhiễm một kí sinh trùng từ loài mèo.

Đăng ngày: 06/07/2021
Ra mắt robot y tá mới, là

Ra mắt robot y tá mới, là "em gái" của người máy Sophia

“Cha đẻ” của công dân robot đầu tiên trên thế giới Sophia vừa cho ra mắt một mẫu người máy mới có tên là Grace hướng tới phục vụ thị trường chăm sóc sức khỏe.

Đăng ngày: 10/06/2021
Trung Quốc dùng công nghệ AI để theo dõi UFO

Trung Quốc dùng công nghệ AI để theo dõi UFO

Các nhà nghiên cứu sử dụng trí tuệ nhân tạo (AI) để theo dõi và phân tích số lượng vật thể bay không xác định ngày càng tăng trong không phận Trung Quốc.

Đăng ngày: 07/06/2021
Tiêu điểm
Khoa Học News