python - 如何使用python识别中文或英文名字

标签 python machine-learning

给定一堆名字,我们如何找出哪些是中文名,哪些是英文名?对于中文名字,我建立了一个中文姓氏列表来找出中文名字。比如李小龙,李是中国姓氏,所以我们都认为李小龙是中国名字。然而,中国姓氏名单很大。有没有更好的办法呢?如果您不熟悉中文名称,您可以告诉如何将英文名称与其他名称(例如法国名称、意大利名称等)区分开来。

最佳答案

如果您有典型的中文和英文名称列表,并且问题仅在于性能,我建议您将列表转换为集合,然后请求两个集合中的成员资格,因为这比查找元素是否存在要快得多在一个大列表中。

关于python - 如何使用python识别中文或英文名字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43684654/

相关文章:

Python装饰器: TypeError: function takes 1 positional argument but 2 were given

Python - pandas - 将系列追加到空白 DataFrame

python - 从 metric_learning LMNN 算法中恢复变换矩阵

python - Beautiful Soup 标签有冒号。需要提取温度值。

python - 如何更新 Pandas Dataframe 中值列表的列

python - 如何处理 pandas 中的插补和热一编码?

machine-learning - 为什么这个卷积的输出有这些维度?

machine-learning - 具有多 GPU 方法的 tensorflow 分布式训练混合

python 发布请求不适用于 Minio 服务器导入

python - 来自 Google 的 TensorFlow - 数据安全