DeepL: mô hình dịch thuật thế hệ mới từ trí tuệ nhân tạo
Cập nhật vào: Thứ sáu - 04/10/2024 00:08 Cỡ chữ
Trong thế giới ngày càng toàn cầu hóa, việc nắm vững nhiều ngôn ngữ đã trở thành một lợi thế quan trọng. Các công cụ dịch thuật dựa trên trí tuệ nhân tạo (AI) ngày càng phát triển, hỗ trợ người dùng vượt qua rào cản ngôn ngữ. Một trong những công cụ dịch thuật tiên tiến và chính xác nhất hiện nay là DeepL, sản phẩm của công ty khởi nghiệp cùng tên. Từ khi ra mắt vào năm 2017, DeepL đã tạo nên dấu ấn trong lĩnh vực dịch thuật nhờ sự kết hợp giữa công nghệ AI và dữ liệu ngôn ngữ do con người cung cấp.
DeepL được sáng lập bởi Jaroslaw Kutylowski, một nhà khoa học máy tính thông thạo ba ngôn ngữ: Đức, Ba Lan và Anh. Với sự hỗ trợ từ DeepL, anh hiện có thể dịch và sử dụng thêm khoảng ba mươi ngôn ngữ khác. Phần mềm dịch thuật của DeepL được đánh giá là chính xác hơn nhiều so với các đối thủ như Google Translate. Để đạt được mức độ chính xác này, DeepL sử dụng kiến trúc mạng nơ-ron nhân tạo độc quyền, cho phép hệ thống tiếp nhận thông tin tương tự như bộ não con người.
DeepL sử dụng một cơ sở dữ liệu khổng lồ, bao gồm các văn bản song ngữ và đơn ngữ bằng 31 ngôn ngữ khác nhau như tiếng Trung Quốc, Nga, Tây Ban Nha và Ý. Mặc dù số lượng ngôn ngữ mà DeepL hỗ trợ chỉ bằng một phần nhỏ so với 130 ngôn ngữ của Google Translate, phần mềm này có ưu điểm về độ chính xác và sắc thái văn hóa. Điều này có được nhờ sự đóng góp của hơn 1.000 biên dịch viên và người bản ngữ trên toàn thế giới, cùng với 20 biên tập viên nội bộ, liên tục đánh giá và điều chỉnh chất lượng bản dịch.
"Chúng tôi cần rất nhiều bản dịch chất lượng cao từ con người để giúp AI hiểu rõ các đặc điểm ngôn ngữ trong cả văn bản thông thường lẫn trang trọng," Kutylowski cho biết. Sự hỗ trợ này giúp DeepL dịch các loại tài liệu đa dạng, từ hợp đồng pháp lý, văn bản tiếp thị đến bài thuyết trình PowerPoint, đồng thời vẫn giữ nguyên định dạng gốc. DeepL không chỉ hỗ trợ người dùng cá nhân mà còn phục vụ hơn 20.000 khách hàng doanh nghiệp, bao gồm những công ty lớn như Mercedes Benz, Fujitsu, và Deutsche Bahn. Tháng 1 năm 2023, DeepL đã huy động được khoảng 100 triệu USD từ các quỹ đầu tư mạo hiểm, định giá công ty ở mức 1 tỷ USD. Phần mềm của DeepL hiện đã được tải xuống hơn 25 triệu thiết bị, và có hơn 10 triệu người dùng hàng tháng, trong đó khoảng 500.000 người sẵn sàng trả phí từ 9 đến 59 USD mỗi tháng.
Tuy chỉ mới được thành lập từ năm 2017, DeepL đã tạo dựng được uy tín về chất lượng dịch thuật. Nina Gafni, một dịch giả chuyên nghiệp từng làm việc cho FBI, đánh giá DeepL vượt trội hơn so với nhiều công cụ khác khi mang lại sắc thái văn hóa chính xác trong các bản dịch. Phần mềm này sử dụng lượng lớn dữ liệu từ phụ đề phim, bản dịch sách, bằng sáng chế và các cuộc trò chuyện trên diễn đàn để đào tạo hệ thống AI.
Điểm khác biệt của DeepL là tính năng cho phép người dùng dịch mọi loại tài liệu, bao gồm PDF, Word và PowerPoint, đồng thời đưa ra các bản dịch thay thế và điều chỉnh cách diễn đạt. DeepL còn cho phép người dùng xây dựng từ điển riêng, định nghĩa cách dịch một số từ nhất định.
Không giống như nhiều công cụ AI khác, DeepL không sử dụng Transformers hay các mô hình ngôn ngữ lớn (LLM) để dịch ngôn ngữ. Thay vào đó, họ dựa vào kiến trúc mạng nơ-ron nhân tạo độc quyền, vốn được Kutylowski phát triển từ năm 2016. Với tầm nhìn chiến lược, Kutylowski dự đoán rằng các phương pháp dịch truyền thống, như dịch máy thống kê, sẽ trở nên lỗi thời trong tương lai.
Karthik Ramakrishnan, giám đốc tại IVP, quỹ đầu tư dẫn dắt vòng huy động vốn series B trị giá 100 triệu USD của DeepL, cho biết thị trường dịch thuật hiện nay có quy mô 27,9 tỷ USD và còn rất nhiều dư địa để phát triển. Ông nhận định phần lớn quy trình dịch thuật hiện nay vẫn được thực hiện thủ công và phụ thuộc vào các đơn vị dịch thuật bên ngoài, thường mất nhiều thời gian để hoàn thành. Với mức độ đánh giá cao từ người dùng và vị thế trên thị trường, DeepL đang nắm bắt cơ hội mở rộng hoạt động kinh doanh.
Tuy nhiên, DeepL cũng đối mặt với nhiều thách thức từ các đối thủ cạnh tranh. Google Translate hỗ trợ 130 ngôn ngữ và được Google đầu tư phát triển AI trong nhiều thập niên. Microsoft Translator cũng là một công cụ mạnh mẽ, hỗ trợ hơn 100 ngôn ngữ và được sử dụng bởi nhiều tập đoàn lớn như Volkswagen Group. Trong khi đó, ChatGPT của OpenAI có thể dịch 50 ngôn ngữ và đang tiếp tục phát triển để cải thiện chất lượng bản dịch.
DeepL hiện chưa có mô hình ngôn ngữ lớn riêng, nhưng Kutylowski có kế hoạch phát triển một mô hình nội bộ kết hợp với mô hình dịch hiện tại để đạt hiệu quả tốt hơn. Công ty đang đầu tư vào nguồn tài nguyên tính toán và sử dụng trung tâm dữ liệu của Nvidia ở Thụy Điển để huấn luyện các mô hình AI.
Kutylowski tin rằng AI tạo sinh sẽ mở ra cơ hội lớn, giúp DeepL phát triển thêm các tính năng bên cạnh dịch thuật, mang lại sự tương tác tự nhiên hơn với người dùng.
DeepL đang dần khẳng định vị thế của mình trong lĩnh vực dịch thuật dựa trên AI nhờ vào sự kết hợp giữa công nghệ mạng nơ-ron nhân tạo và dữ liệu chất lượng cao từ con người. Mặc dù đối mặt với sự cạnh tranh gay gắt từ các đối thủ như Google Translate, Microsoft Translator và ChatGPT, DeepL đã xây dựng cho mình một nền tảng vững chắc với mức độ chính xác cao. Với sự phát triển liên tục của công nghệ AI, DeepL có tiềm năng mở rộng phạm vi ứng dụng và trở thành công cụ không thể thiếu trong lĩnh vực dịch thuật toàn cầu.
P.A.T (NASATI), theo Forbes, 9/2024