Thứ ba, 14/11/2017 - 06:00

Sản phẩm vào Chung khảo NTĐV 2017:

Công cụ giúp dẹp tan nỗi lo sai lỗi chính tả khi soạn thảo văn bản

Dân trí

Bạn lo ngại sẽ gặp phải các lỗi chính tả khi soạn thảo văn bản bằng tiếng Việt, nhưng không muốn mất quá nhiều thời gian để kiểm tra lại lỗi chính tả trong văn bản? Một công cụ được ra đời để giúp tự động kiểm tra lỗi chính tả trên văn bản một cách nhanh chóng.

"Phong ba bão táp không bằng ngữ pháp Việt Nam”, với sự phức tạp của tiếng Việt, không phần mềm nào có thể phát hiện ra tất cả các lỗi chính tả có trong văn bản. Do vậy, điều quan trọng vẫn ở yếu tố con người và bạn chỉ nên sử dụng phần mềm như một công cụ phụ trợ để phát hiện các lỗi chính tả có thể gặp phải.

DoIT là sản phẩm của nhóm tác giả đến từ trường Đại học Công nghệ (Đại học Quốc gia Hà Nội), bao gồm 2 tính năng cơ bản là kiểm lỗi chính tả trên văn bản tiếng Việt và phát hiện trùng lặp cho tài liệu tiếng Việt. Hệ thống có thể xử lý các tài liệu ở phần lớn các định dạng phổ biến hiện nay như doc, docx, pdf, ppt...

DoIT chỉ ra những lỗi sai chính tả và đưa ra những từ gợi ý để thay thế
DoIT chỉ ra những lỗi sai chính tả và đưa ra những từ gợi ý để thay thế

Với chức năng kiểm lỗi chính tả, DoIT ngoài việc chỉ ra các từ bị lỗi còn đề xuất từ đúng thay thế. DoIT không chỉ kiểm tra lỗi chính tả theo từ đơn thuần mà kiểm tra lỗi chính tả theo từng ngữ cảnh, theo ngữ pháp của câu... Ví dụ: trong câu “Cuốn xách này rất hay”, từ “xách” mang ý nghĩ là mang, vác theo đã bị dùng sai, từ chính xác cần được dùng ở đây là từ “sách”.

Chức năng phát hiện trùng lặp sẽ chỉ ra phần trùng trong văn bản được kiểm tra với các phần của các tài liệu có trong cơ sở dữ liệu (CSDL) của hệ thống. Có ba mức trùng lặp gồm cao, thấp, và trung bình và được thể hiện bằng ba màu. Người dùng có thể chia sẻ, gửi tài liệu qua hệ thống. Tính năng phát hiện trùng lặp sẽ giúp kiểm tra xem nội dung của văn bản có trùng với nội dung của một tài liệu nào đã được công bố trước đó hay không (chống sao chép).

DoIT sẽ giúp cho người dùng tạo ra các văn bản chất lượng cao, tránh các lỗi chính tả không đáng có trong văn bản. Đặc biệt, sản phẩm sẽ là một công cụ hiệu quả hỗ trợ cho các đơn vị đào tạo kiểm tra và hạn chế sự trùng lặp văn bản (đặc biệt là khóa luận và luận văn). Thay vì phải sử dụng trí nhớ hoặc sử dụng các máy tìm kiếm, các giảng viên có thể dùng DoIT để nâng cao độ chính xác trong việc đánh giá văn bản.

Hiện tại DoIT đang được triển khai áp dụng tại Đại học Quốc gia Hà Nội, với khoảng 3.000 người dùng và khoảng 7.000 tài liệu trong cơ sở dữ liệu để kiểm tra sự trùng lặp. Người dùng của hệ thống phần lớn từ các trường thành viên của ĐHQGHN và các trường Đại học Thủy lợi, Học viện Công nghệ Bưu chính Viễn thông, Đại học Thái Nguyên...

Sản phẩm DoIT được cung cấp trên nền web, giúp người dùng có thể sử dụng ở bất kỳ thiết bị nào, miễn là có kết nối Internet. Bạn đọc có thể trải nghiệm sản phẩm tại http://doit.uet.vnu.edu.vn hoặc tại http://doit.lic.vnu.edu.vn.

Nhận thấy những tiềm năng và khả năng mở rộng trên quy mô lớn của DoIT, Hội đồng Giám khảo của Giải thưởng Nhân tài Đất Việt đã quyết định chọn đây là một trong 7 sản phẩm CNTT Triển vọng, lọt vào vòng Chung khảo cùng với 16 sản phẩm khác để cùng tranh tài, tìm ra người chiến thắng cho cuộc thi năm nay.

Video hướng dẫn cách thức sử dụng của công cụ kiểm tra chính tả DoIT

T.Thủy