viblo.asia

Bài học rút ra từ sự thất bại của các dự án AI Proof of Concepts

(Bài viết này được viết dựa trên bài viết 9 Lessons learned from failed AI PoCs nhưng thay vì dịch lại hoàn toàn, mình viết lại cả bằng góc nhìn và quan điểm cá nhân.) PoCs - Proof of Concepts Proof of concepts(PoCs) hiểu đơn giản là việc hiện thực hóa một phương pháp hoặc một ý tưởng nhất định để chứng minh tính khả thi của giải pháp và tiềm năng của nó trong thực tế. Một PoC thường nhỏ và có thể hoàn thành hoặc không vì đơn...

viblo.asia

Ứng dụng Machine translation vào bài toán thêm dấu cho Tiếng Việt không dấu (AIVIVN challenge 3)

Giới thiệu bài toán Bài toán thêm dấu cho tiếng Việt là một bài toán khá hay và thú vị. Do đặc điểm thói quen của người dùng, do đặc điểm khác nhau của các bộ gõ, nhiều người dùng Việt Nam tạo nội dung không dấu trên internet. Đây là một thách thức lớn dành cho các nhà khoa học dữ liệu khi phải đồng bộ tất cả dữ liệu về cùng 1 dạng (tiếng Việt có dấu với cùng 1 chuẩn bộ gõ) để có thể khai thác được thông tin từ...

viblo.asia

Hiểu về Regular expression: Xử lý ngôn ngữ tự nhiên đơn giản hơn với Python

Regular Expression là gì? Một biểu thức chính quy là một chuỗi các ký tự được định nghĩa theo một quy tắt định trước nhằm xác định một tập hơn các chuỗi phù hợp với nó. Các biểu thức chính quy có thể được ghép nối để tạo thành các biểu thức chính quy mới. Nếu A và B là hai biểu thức chính quy thì AB cũng là 1 biểu thức chính quy và nếu chuỗi a khớp với biểu thức A và một chuỗi b khác khớp với biểu thức B thì...