Tags » Unicode

Unicode 8.0: More languages, more emoji

Encoding all the characters of all the world’s languages is an endless task. Unicode 8.0 improves the treatment of Cherokee, Tai Lue, Devangari, and more. For a lot of people, the most interesting part will be the implementation of “diverse” emoji in a variety of colors. 461 more words

News

Tamil Latha Font for MSWord (Office 2010) in Windows 10

Tamil Latha Font for MSWord (Office 2010) in Windows 10

Going from default Nirmala UI (Windows 10) to Latha

Thayumana Somasundaram     Tuesday, Aug 25, 2015. 542 more words

Family

Talking precisely about Unicode

In What’s a pilcrow, we discussed the babel that arises when different people arbitrarily pick numbers to represent characters and then try to communicate: 1,083 more words

Text Processing

วิธีแก้ชื่อเพลง MP3 ภาษาต่างดาว

พอดีว่าผมเจอปัญหาว่าเพลงที่มีอยู่ในคอมพิวเตอร์กลายเป็นภาษาต่างดาวหลังจากอัพเกรดวินโดวส์ จริงๆ ก็ไม่เชิงอัพเกรด แต่เป็นการลงใหม่เลย (clean install) หากใครนึกภาพไม่ออก ลองดูตัวอย่างภาพด้านล่าง

ปัญหานี้เกิดจากการเข้ารหัสภาษาที่ผิดพลาด วินโดวส์รุ่นใหม่ๆ ใช้ Unicode เป็นค่าตั้งต้น แต่เพลงที่เกิดปัญหาเหล่านี้ถูกสร้างขึ้นมาจากวินโดวส์เวอร์ชันเก่าที่ใช้การเข้ารหัสอักขระแบบ TIS-602 แต่เพลงใหม่ๆ ที่ส่วนมากซื้อจาก iTunes จะไม่เจอปัญหานี้ วิธีแก้ปัญหาคือไปตั้งค่าการเข้ารหัสอักขระเมื่อไม่ใช่ Unicode ดังนี้ 43 more words

คอมพิวเตอร์ อินเทอร์เน็ต และเทคโนโลยี

Install Sinhala Unicode in Arch Linux

First install wget package and install lklug.ttf font using following commands.

# pacman -S wget
# wget -P /usr/share/fonts http://sinhala.sourceforge.net/files/lklug.ttf
# fc-cache -fv

Now edit /etc/locale.gen file and uncomment si_LK UTF-8 line. 96 more words

Arch

Here’s what the next 38 emoji might look like—including bacon, a clown, and the selfie

We are getting closer to being able to convey emotion and meaning entirely through emoji. The Unicode Consortium, the governing body of the how text renders on computers, … 293 more words