Loại bỏ dấu tiếng việt bằng JavaScript

Khi làm việc với tiếng việt, để xóa hay loại bỏ dấu của tiếng việt bằng javascript ta thực hiện các bước đơn giản sau đây: 1. Cài đặt gói thư viện Giả sử trên máy tính của bạn đã cài đặt Node.js, ta sẽ cài đặt 1 gói thư viện có tên diacritic hỗ […]

Read More

Mô hình ngữ âm là gì ?

Một mô hình ngữ âm là một file chứa các đặc trưng thống kê của mỗi âm tiết riêng biệt, mà chúng tạo thành một từ; Tức là, một từ sẽ có một mô hình ngữ âm của riêng nó. Mỗi một đặc trưng thống kê được gán một nhãn được gọi là âm vị […]

Read More

Đặc trưng của tiếng việt

Các thông số và đặc trưng của tiếng Việt Như: số từ, số âm tiết, thông tin uni-gram, bi-gram, .. Số từ : lấy từ Vietnam Lexicography Center (Vietlex) gồm 40181 từ. (Những từ được sử dụng nhiều và rộng rãi nhất) Số âm tiết : 7729 âm tiết. (Cùng nguồn trên) 81.55% các âm […]

Read More