python - 将 post.get ('href' ) 转换为文本或字符串形式,Excel 无法处理超过 255 个字符的超链接

标签 python excel python-3.x beautifulsoup href

当我将 URL 写入 Excel(从 Python 脚本)时,不会写入超过 255 个字符。但我实际上不需要 URL 附加一个超链接。

例如,我需要“www.ebay.co.uk”,但不需要“www.ebay.co.uk” '。只要我有文本,那么我的脚本的下一部分就可以正常工作。

我尝试了 str() 和 .text,但都没有成功

str()

if (post.get('title'))!=None:
   df1.loc[Row] = [str((post.get('href'))),Row]
   Row = Row + 1

.text

if (post.get('title'))!=None:
    df1.loc[Row] = [(post.get('href')).text,Row]
    Row = Row + 1

最佳答案

pandas.ExcelWriter 有一个 options 参数,您可以将其与 xlsxwriter 引擎结合使用以防止字符串到 URL 的转换:

df = pd.DataFrame({
    'data': [
        'http://www.python.org/',
        'http://' + 'a'*250,
    ]
})

with pd.ExcelWriter('0.xlsx',
                    engine='xlsxwriter',
                    options={'strings_to_urls': False}) as writer:
    df.to_excel(writer)

links as strings

来源:XlsxWriter Docs

关于python - 将 post.get ('href' ) 转换为文本或字符串形式,Excel 无法处理超过 255 个字符的超链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58423535/

相关文章:

python - Django-cms错误 "unsupported operand type(s) for +: '设置'和 'tuple'“

python - 如何使用 Python 2.7 在 itertools 中使用 zip_longest

vba - 图表中的系列删除

python - 如何在 tkinter 中正确保存文件

python - 有没有一种方法可以在不抓取的情况下从 PyPI 访问搜索结果?

python - Tkinter,Entry 小部件,是否可以检测输入文本?

python - 使用 DataFrame 我想添加一个将写入 Field1、Field2 的列...(包含与 index-1 一样多的行)

excel - 从第 1 列的数据和第 2 列的数据中搜索并显示第 2 列的数据的公式

python - Pandas 中列的多个索引

python - 为什么我在使用 wx.SplitterWindow 时会出现故障?