Ứng dụng giúp nhận diện và trích xuất nội dung văn bản từ hình ảnh

Dân trí

Bạn muốn trích xuất một đoạn văn bản có trong hình ảnh hoặc muốn sao chép nhanh một đoạn nội dung từ trang báo giấy hoặc từ cuốn sách nào đó? Ứng dụng miễn phí dưới đây sẽ giúp bạn nhận diện và trích xuất nội dung văn bản từ hình ảnh để bạn có thể thực hiện những điều trên một cách dễ dàng.

Có đôi khi bạn muốn sao chép một đoạn nội dung văn bản nào đó trên sách hoặc trên giấy tờ, báo chí... để sử dụng trên smartphone hoặc máy tính của mình. Nhiều người sẽ chọn giải pháp ngồi gõ lại toàn bộ đoạn nội dung cần sử dụng, tuy nhiên với sự giúp đỡ của Text Scanner, mọi chuyện có thể trở nên dễ dàng hơn.

Text Scanner (OCR) là ứng dụng miễn phí, sử dụng kỹ thuật nhận dạng ký tự quang học (OCR), cho phép nhận diện và trích xuất các nội dung văn bản từ hình ảnh để chuyển đoạn văn bản trên smartphone. Với Text Scanner, khi muốn sao chép một đoạn văn bản nào đó từ bên ngoài vào smartphone, bạn chỉ việc chụp ảnh lại đoạn nội dung văn bản cần sao chép, ứng dụng sẽ trích xuất nội dung văn bản có trên hình ảnh để người dùng sử dụng.

Ứng dụng cũng hữu ích trong trường hợp bạn muốn quét nhanh một số điện thoại nào đó trên danh thiếp hoặc trên bảng hiệu, bạn chỉ việc chụp lại số điện thoại in trên đó, ứng dụng sẽ tự động nhận diện và trích xuất số điện thoại để người dùng lưu lại và sử dụng mà không cần phải tự nhập số bằng tay.

Quá trình thử nghiệm cho thấy Text Scanner nhận diện khá tốt ngôn ngữ tiếng Việt.

Download ứng dụng miễn phí tại đây hoặc tại đây (tương thích Android 4.1 trở lên).

Cách dùng của ứng dụng khá đơn giản. Giao diện chính của Text Scanner là một giao diện chụp ảnh, cho phép người dùng chụp lại hình ảnh của đoạn văn bản muốn nhận diện chữ viết. Bạn nên chụp ảnh sao cho tập trung vào đoạn nội dung văn bản cần nhận diện, chẳng hạn nếu bạn muốn nhận diện một đoạn văn bản trên trang web, bạn nên tập trung vào đoạn nội dung chính, thay vì chụp cả những nội dung quảng cáo xung quanh... sẽ khiến cho ứng dụng khó nhận diện được chính xác.

Ngoài ra, bạn có thể nhấn vào biểu tượng hình ảnh ở phía trên để chọn một hình ảnh sẵn có trong smartphone của mình để nhận diện chữ viết trên hình ảnh đó. Với cách thức này, bạn có thể tải một hình ảnh từ Internet hoặc dùng ứng dụng chụp ảnh mặc định trên smartphone để chụp lại đoạn văn bản cần nhận diện chữ viết để sử dụng trong Text Scanner.

Nhấn vào biểu tượng hình ảnh (mũi tên đỏ) nếu muốn sử dụng hình ảnh sẵn có trên smartphone để trích xuất nội dung
Nhấn vào biểu tượng hình ảnh (mũi tên đỏ) nếu muốn sử dụng hình ảnh sẵn có trên smartphone để trích xuất nội dung

Sau khi chụp ảnh, chờ trong giây lát, ứng dụng Text Scanner sẽ tự động quét và nhận diện văn bản có trong hình ảnh chụp, từ đó trích xuất đoạn văn bản từ hình ảnh đã chụp.

Tại giao diện tiếp theo, bạn có thể nhấn vào biểu tượng cây viết ở góc trên bên phải để chỉnh sửa lại đoạn văn bản đã được nhận diện từ hình ảnh sao cho chính xác và hoàn chỉnh hơn.

Ứng dụng giúp nhận diện và trích xuất nội dung văn bản từ hình ảnh - 2

Trong quá trình thử nghiệm, Text Scanner cho thấy nhận diện khá chính xác các văn bản bằng tiếng Anh, trong khi đó với các hình ảnh chứa văn bản bằng tiếng Việt, ứng dụng cũng nhận diện khá ổn, tuy nhiên lại thường xảy ra hiện tượng mất dấu trong từng từ. Do vậy người dùng có thể chỉnh sửa lại đoạn văn bản sau khi nhận diện và thêm dấu vào từng từ để văn bản trở nên chính xác và hoàn chỉnh hơn. Dù sao việc chỉnh sửa các lỗi trong văn bản vẫn nhanh hơn là gõ lại toàn bộ đoạn văn bản.

Có thể nói Text Scanner là một trong những ứng dụng nhận diện chữ viết từ hình ảnh chính xác nhất hiện nay, bao gồm cả tiếng Việt, vốn được đánh giá là loại ngôn ngữ khó và phức tạp trong quá trình nhận diện chữ viết.

Phạm Thế Quang Huy