python - 在 Python 中分割文本

标签 python python-2.7

我正在编写一些脚本,从网站捕获数据并将其保存到数据库中。有些数据已合并,我需要拆分它们。我有这样的东西

Endokrynologia (bez st.),Położnictwo i ginekologia (II st.)

所以我需要得到:

Endokrynologia (bez st.)
Położnictwo i ginekologia (II st.)

所以我用 python 写了一些代码:

 #!/usr/bin/env python
# -*- encoding: utf-8

import MySQLdb as mdb
from lxml import html, etree
import urllib
import sys
import re

Nr = 17268
Link = "http://rpwdl.csioz.gov.pl/rpz/druk/wyswietlKsiegaServletPub?idKsiega="

sock = urllib.urlopen(Link+str(Nr))  
htmlSource = sock.read()                             
sock.close()
root = etree.HTML(htmlSource)
result = etree.tostring(root, pretty_print=True, method="html")
Spec = etree.XPath("string(//html/body/div/table[2]/tr[18]/td[2]/text())")
Specjalizacja = Spec(root)
if re.search(r'(,)\b', Specjalizacja):
    text = Specjalizacja.split()
    print text[0]
    print text[1]

我得到:

Endokrynologia
(bez

我做错了什么?

最佳答案

你会尝试更换

text = Specjalizacja.split()

text = Specjalizacja.split(',')

不知道这是否能解决您的问题。

关于python - 在 Python 中分割文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16154623/

相关文章:

python - Suds:响应中未找到类型

python - 下载时解压缩存档

python - 写入 Pickle 文件时出现 FileNotFoundError

python - 在 Python 中读取 Maven Pom xml

jinja2 中的 python 三元给出 TemplateSyntaxError : tag name expected

python - scapy 操作系统错误 : [Errno 9] Bad file descriptor

python - 为什么在尝试使用请求库进行网络抓取时,我得到的正文标签内容为空?

python - 如何在 strptime 中使用俄语日期字符串

python - Tkinter 文本小部件关键字着色

python - 将 python 类对象作为参数传递给 c 库