python - 将连续的重复字符替换为一个 - 逐列操作 - `pandas.DataFrame`

标签 python pandas

如何删除字符串中的重复字符并只保留其中一个。

例如:-

"Bertuggggg Mete" 

"Bertug Mete"

我刚刚读取了这样的数据:

dataFrame = pd.read_excel("C:\\Users\\Bertug\\Desktop\\example.xlsx")

姓名 0 贝尔图格米特

输入是从 .xlsx 文件读取的。我尝试过分割和剥离功能,但它们不起作用,似乎按预期工作。

我该如何解决这个问题?

最佳答案

看看这个:

column_name 替换为您想要应用替换的列名称。

min_threshold_rep = 2
column_name = 'Name'
dataframe[column_name]= dataframe[column_name].str.replace(r'(\w)\1{%d,}'%(min_threshold_rep-1), r'\1')

注意:这会将每 min_threshold_rep 个连续字符替换为一个字符。

关于python - 将连续的重复字符替换为一个 - 逐列操作 - `pandas.DataFrame`,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43110237/

相关文章:

python - 类型错误 : object of type 'builtin_function_or_method' has no len() Codeacademy

python - 尝试运行 pgAdmin4 时出错

python - pandas 更改重复行的特定列值

python - 通过与训练数据的一致映射来分解实时数据?

python - 如何按名称获取列的索引?

python - 编程错误 : permission denied for relation django_session

python - 一定数量的字符后标准输出循环停止

python - 测试失败,返回 `django.db.utils.IntegrityError`

python - 数据集在 Pandas 数据框中每月有多少天有记录?

python - 如何将 pandas Series 的 "rows"转换为 DataFrame 的列?