可见规律性不强,只能说由于ID与姓名的天然关联性,姓氏和ID首字母有一定联系。
3.部分含汉字ID
部分含汉字ID样本从顺序组成可分为汉字开头(占78%)和英文(数字)开头(占22%)两种,可见这部分用户主要还是喜欢汉字+英文(数字)这种形式的ID,如“机器猫dora2”,符合书写习惯。而不是如“dora2机器猫”这种看上去有点怪的情况。但是想到无汉字ID的绝对高占比,可见网络ID上,用户总体而言还是喜欢英文的。
小结:
绝大多数用户ID中不会含汉字,平均长度9个字符;
汉字精悍,总体而言ID含汉字平均长度就较短,而且含汉字ID习惯以汉字开头;
ID与用户姓名具有天然的联系。
文章TAG:文本分析 用户体验