【Python3】

之前做的入门练习里有一题将excel文件转化为xml文件,这回补上逆向转换→xml to excel

用的还是beautifulsoup

主要还是:①读取待处理文件文本内容 ②处理文本写入数据到所需格式文件中

原xml文件如下:

<?xml version="1.0"?>
<doc>
<taxML cnName="增值税发票开具明细" xmlns="http://www.chinatax.gov.cn/dataspec/" name="slSbbtjZzsfpkjmxRequest" version="SW5001-2006" xsi:type="slSbbtjZzsfpkjmxRequest" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<sbbZzsfpkjmx>
<head>
<publicHead>
<nsrsbh>440100581884333</nsrsbh>
<nsrmc>广州贝凡信息技术有限公司</nsrmc>
<tbrq>20160801</tbrq>
<sssq>
<rqQ>20160101</rqQ>
<rqZ>20160831</rqZ>
</sssq>
</publicHead>
</head>
<body>
<zyfpkjmx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117808</fphm>
<kprq>20160107 11:16:03</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>1</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117809</fphm>
<kprq>20160107 11:18:54</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>2</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117810</fphm>
<kprq>20160107 11:20:09</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>3</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117811</fphm>
<kprq>20160107 11:22:58</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>142.03</je>
<se>8.52</se>
<zfbz>N</zfbz>
<xh>4</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117812</fphm>
<kprq>20160107 11:24:28</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>5</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117813</fphm>
<kprq>20160107 11:26:07</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>60417.70</je>
<se>3625.06</se>
<zfbz>N</zfbz>
<xh>6</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117814</fphm>
<kprq>20160107 11:32:33</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>7</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117815</fphm>
<kprq>20160107 11:34:30</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>434.35</je>
<se>26.06</se>
<zfbz>N</zfbz>
<xh>8</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117816</fphm>
<kprq>20160107 11:35:54</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>9</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117817</fphm>
<kprq>20160107 11:37:47</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>10</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117818</fphm>
<kprq>20160107 11:39:00</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>11</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117819</fphm>
<kprq>20160107 11:39:53</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>12</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117820</fphm>
<kprq>20160107 11:41:13</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>13</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117821</fphm>
<kprq>20160107 11:42:21</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>14</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117822</fphm>
<kprq>20160107 11:43:38</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>8740.53</je>
<se>524.43</se>
<zfbz>N</zfbz>
<xh>15</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117823</fphm>
<kprq>20160112 12:16:13</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>Y</zfbz>
<xh>16</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117824</fphm>
<kprq>20160112 12:29:19</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>17</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117825</fphm>
<kprq>20160112 12:33:53</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>30428.34</je>
<se>1825.70</se>
<zfbz>N</zfbz>
<xh>18</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117826</fphm>
<kprq>20160113 12:44:58</kprq>
<gmfnsrsbh>441601749182176</gmfnsrsbh>
<je>21650.94</je>
<se>1299.06</se>
<zfbz>N</zfbz>
<xh>19</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117827</fphm>
<kprq>20160129 12:09:48</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>20</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117828</fphm>
<kprq>20160129 12:11:15</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>21</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117829</fphm>
<kprq>20160129 12:12:25</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>22</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117830</fphm>
<kprq>20160129 12:14:05</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>23</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117831</fphm>
<kprq>20160129 12:15:31</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>24</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117832</fphm>
<kprq>20160129 12:16:57</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>25</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117833</fphm>
<kprq>20160129 12:18:07</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>26</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117834</fphm>
<kprq>20160129 12:19:11</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>27</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117835</fphm>
<kprq>20160129 12:20:03</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>28</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117836</fphm>
<kprq>20160129 12:20:53</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>29</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199509</fphm>
<kprq>20160129 13:52:10</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>30</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199510</fphm>
<kprq>20160129 13:53:27</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>31</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199511</fphm>
<kprq>20160129 13:54:18</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>32</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199512</fphm>
<kprq>20160129 13:55:24</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>33</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199513</fphm>
<kprq>20160129 13:56:23</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>34</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199514</fphm>
<kprq>20160129 13:58:24</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>35</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199515</fphm>
<kprq>20160129 13:59:39</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>22371.25</je>
<se>1342.27</se>
<zfbz>N</zfbz>
<xh>36</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199516</fphm>
<kprq>20160303 13:49:44</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>15091.66</je>
<se>905.50</se>
<zfbz>N</zfbz>
<xh>37</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199517</fphm>
<kprq>20160303 13:52:13</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>53915.00</je>
<se>3234.90</se>
<zfbz>N</zfbz>
<xh>38</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199518</fphm>
<kprq>20160303 13:54:22</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>39</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199519</fphm>
<kprq>20160303 13:55:30</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>40</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199520</fphm>
<kprq>20160303 13:56:30</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>41</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199521</fphm>
<kprq>20160303 13:57:56</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>42</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199522</fphm>
<kprq>20160303 13:58:48</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>43</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199523</fphm>
<kprq>20160303 14:00:11</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>44</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199524</fphm>
<kprq>20160303 14:02:45</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>45</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199525</fphm>
<kprq>20160303 14:04:04</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>46</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199526</fphm>
<kprq>20160303 14:06:00</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>20448.11</je>
<se>1226.89</se>
<zfbz>N</zfbz>
<xh>47</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199527</fphm>
<kprq>20160307 11:24:32</kprq>
<gmfnsrsbh>110106783995939</gmfnsrsbh>
<je>50283.02</je>
<se>3016.98</se>
<zfbz>Y</zfbz>
<xh>48</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199528</fphm>
<kprq>20160307 11:26:36</kprq>
<gmfnsrsbh>110106783995939</gmfnsrsbh>
<je>51886.79</je>
<se>3113.21</se>
<zfbz>Y</zfbz>
<xh>49</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199529</fphm>
<kprq>20160307 11:35:41</kprq>
<gmfnsrsbh>110106783995939</gmfnsrsbh>
<je>50283.02</je>
<se>3016.98</se>
<zfbz>N</zfbz>
<xh>50</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199530</fphm>
<kprq>20160307 11:36:52</kprq>
<gmfnsrsbh>110106783995939</gmfnsrsbh>
<je>51886.79</je>
<se>3113.21</se>
<zfbz>N</zfbz>
<xh>51</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199531</fphm>
<kprq>20160310 11:39:04</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>84218.44</je>
<se>5053.11</se>
<zfbz>N</zfbz>
<xh>52</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199532</fphm>
<kprq>20160310 17:07:28</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>53</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199533</fphm>
<kprq>20160310 17:12:42</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>23911.56</je>
<se>1434.69</se>
<zfbz>N</zfbz>
<xh>54</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199534</fphm>
<kprq>20160317 17:18:11</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>34106.16</je>
<se>2046.37</se>
<zfbz>N</zfbz>
<xh>55</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199535</fphm>
<kprq>20160321 11:58:10</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>465.58</je>
<se>27.94</se>
<zfbz>N</zfbz>
<xh>56</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199536</fphm>
<kprq>20160412 11:44:03</kprq>
<gmfnsrsbh>441601749182176</gmfnsrsbh>
<je>21650.94</je>
<se>1299.06</se>
<zfbz>N</zfbz>
<xh>57</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199537</fphm>
<kprq>20160412 11:46:11</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>58</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199538</fphm>
<kprq>20160412 11:48:16</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>26140.43</je>
<se>1568.43</se>
<zfbz>N</zfbz>
<xh>59</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947256</fphm>
<kprq>20160425 16:05:03</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>60</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947257</fphm>
<kprq>20160425 16:07:05</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>7281.89</je>
<se>436.91</se>
<zfbz>N</zfbz>
<xh>61</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947258</fphm>
<kprq>20160426 17:33:48</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>56935.85</je>
<se>3416.15</se>
<zfbz>N</zfbz>
<xh>62</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947259</fphm>
<kprq>20160607 13:33:45</kprq>
<gmfnsrsbh>91440000190351003U</gmfnsrsbh>
<je>97087.38</je>
<se>2912.62</se>
<zfbz>Y</zfbz>
<xh>63</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947260</fphm>
<kprq>20160607 13:40:27</kprq>
<gmfnsrsbh>91440000190351003U</gmfnsrsbh>
<je>19911.46</je>
<se>597.34</se>
<zfbz>Y</zfbz>
<xh>64</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947261</fphm>
<kprq>20160607 17:14:14</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>65</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947262</fphm>
<kprq>20160607 17:18:44</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>6091.66</je>
<se>365.50</se>
<zfbz>N</zfbz>
<xh>66</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947263</fphm>
<kprq>20160607 17:36:18</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>76950.19</je>
<se>4617.01</se>
<zfbz>N</zfbz>
<xh>67</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947264</fphm>
<kprq>20160607 17:37:46</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>68</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947265</fphm>
<kprq>20160607 17:39:49</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>69</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947266</fphm>
<kprq>20160607 17:41:03</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>70</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947267</fphm>
<kprq>20160607 17:42:28</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>71</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947268</fphm>
<kprq>20160607 17:43:23</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>72</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947269</fphm>
<kprq>20160607 17:46:36</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>44303.26</je>
<se>2658.20</se>
<zfbz>N</zfbz>
<xh>73</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947270</fphm>
<kprq>20160608 12:56:10</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>74</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947271</fphm>
<kprq>20160608 12:57:43</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>75</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947272</fphm>
<kprq>20160608 12:59:23</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>65097.55</je>
<se>3905.85</se>
<zfbz>N</zfbz>
<xh>76</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947273</fphm>
<kprq>20160616 17:36:20</kprq>
<gmfnsrsbh>91440000190351003U</gmfnsrsbh>
<je>97087.38</je>
<se>2912.62</se>
<zfbz>N</zfbz>
<xh>77</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947274</fphm>
<kprq>20160616 17:41:26</kprq>
<gmfnsrsbh>91440000190351003U</gmfnsrsbh>
<je>19911.46</je>
<se>597.34</se>
<zfbz>N</zfbz>
<xh>78</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947275</fphm>
<kprq>20160622 11:52:50</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>18955.47</je>
<se>1137.33</se>
<zfbz>N</zfbz>
<xh>79</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947276</fphm>
<kprq>20160623 12:55:56</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>80052.88</je>
<se>4803.17</se>
<zfbz>N</zfbz>
<xh>80</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947277</fphm>
<kprq>20160623 17:18:44</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>81</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947278</fphm>
<kprq>20160623 17:22:32</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>48811.51</je>
<se>2928.69</se>
<zfbz>N</zfbz>
<xh>82</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947279</fphm>
<kprq>20160630 11:44:56</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>83</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947280</fphm>
<kprq>20160630 11:46:32</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>7771.70</je>
<se>466.30</se>
<zfbz>N</zfbz>
<xh>84</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947281</fphm>
<kprq>20160706 17:13:12</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>7253.25</je>
<se>435.19</se>
<zfbz>Y</zfbz>
<xh>85</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947282</fphm>
<kprq>20160706 17:21:08</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>7253.25</je>
<se>435.19</se>
<zfbz>N</zfbz>
<xh>86</xh>
</mxxx>
<mxxx>
<fpdm>4400154130</fpdm>
<fphm>10394896</fphm>
<kprq>20160713 11:53:26</kprq>
<gmfnsrsbh>441601749182176</gmfnsrsbh>
<je>21650.94</je>
<se>1299.06</se>
<zfbz>Y</zfbz>
<xh>87</xh>
</mxxx>
<mxxx>
<fpdm>4400154130</fpdm>
<fphm>10394897</fphm>
<kprq>20160714 11:53:23</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>71216.98</je>
<se>4273.02</se>
<zfbz>N</zfbz>
<xh>88</xh>
</mxxx>
<mxxx>
<fpdm>4400154130</fpdm>
<fphm>10394898</fphm>
<kprq>20160720 10:58:42</kprq>
<gmfnsrsbh>440106749182803</gmfnsrsbh>
<je>13698.11</je>
<se>821.89</se>
<zfbz>N</zfbz>
<xh>89</xh>
</mxxx>
<mxxx>
<fpdm>4400154130</fpdm>
<fphm>10394899</fphm>
<kprq>20160728 12:25:07</kprq>
<gmfnsrsbh>914416027491821765</gmfnsrsbh>
<je>21650.94</je>
<se>1299.06</se>
<zfbz>N</zfbz>
<xh>90</xh>
</mxxx>
</zyfpkjmx>
<zyfpkjhjxx>
<zyfpkjhjs>90</zyfpkjhjs>
<zzszyfphjJe>6134426.75</zzszyfphjJe>
<zzszyfphjSe>361045.81</zzszyfphjSe>
</zyfpkjhjxx>
<ptfpkjmx />
<ptfpkjhjxx>
<ptfpkjhjs>0</ptfpkjhjs>
<ptfpkjhjJe>0</ptfpkjhjJe>
<ptfpkjhjSe>0</ptfpkjhjSe>
</ptfpkjhjxx>
</body>
</sbbZzsfpkjmx>
</taxML>
<doc>

目标是将以下标签内内容提取成列表格式:

          <fpdm>...</fpdm>
<fphm>...</fphm>
<kprq>...</kprq>
<gmfnsrsbh>...</gmfnsrsbh>
<je>...</je>
<se>...</se>
<zfbz>...</zfbz>
<xh>...<z/xh>

Code(粗糙应用版):

from bs4 import BeautifulSoup
import xlwt with open('cww.xml', 'r') as f:
xml_doc =f.read() #读取xml文本内容 soup = BeautifulSoup(xml_doc, 'html.parser')
keyword = ['fpdm','fphm','kprq','gmfnsrsbh','je','se','zfbz','xh'] #关键词list datatable = xlwt.Workbook(encoding='utf-8', style_compression=0)
newsheet = datatable.add_sheet('mxxx', cell_overwrite_ok=True) #新建excel文档sheet num = 0 #列 for i in range(len(keyword)):
newsheet.write(0, num, keyword[i]) #写入每列keyword
info_list = []
for se in soup.find_all(keyword[i]):
info = se.get_text()
info_list.append(info) #找出所有对应标签内的text组成list
print(info_list)
for i in range(len(info_list)):
newsheet.write(i+1, num, info_list[i]) #将该list中数据以列写入excel表
num += 1 #列数加一,继续遍历关键词写入excel表格 datatable.save('liez.xls')

整理结果如图:

【待续】

【Python】Xml To Excel的更多相关文章

  1. 【Python】xml 解析

    1. XML:指可扩展标记语言,是一种标记语言,用于存储数据和传输数据,但没有像HTML那样具有预定义标签,需要程序猿自定义标签 2. XML的解析:读取XML数据结构中的某些信息,比如读取书的属性 ...

  2. 【Python】实现将Excel编写的用例上传到testlink指定用例集

    背景 百科上说TestLink 是基于web的测试用例管理系统,主要功能是测试用例的创建.管理和执行,并且还提供了一些简单的统计功能.其他的信息可以参照他们的官网http://www.testlink ...

  3. 【Python】 xml转json

    虽然python有解析xml的模块,也有生成json的模块,但是没有把这两者连接起来的模块. 下面是以来自MIT的大神Martin Blech写的一个方便的模块,供大家参考.也别忘了在用之前先拜谢作者 ...

  4. 【Python】 xml解析与生成 xml

    xml *之前用的时候也没想到..其实用BeautifulSoup就可以解析xml啊..因为html只是xml的一种实现方式吧.但是很蛋疼的一点就是,bs不提供获取对象的方法,其find大多获取的都是 ...

  5. 【Python】xml遍历练习

      <?xml version="1.0" encoding="utf-8" ?> <!--this is a test about xml. ...

  6. 【原创】.NET读写Excel工具Spire.Xls使用(1)入门介绍

    在.NET平台,操作Excel文件是一个非常常用的需求,目前比较常规的方法有以下几种: 1.Office Com组件的方式:这个方式非常累人,微软的东西总是这么的复杂,使用起来可能非常不便,需要安装E ...

  7. 【python】列出http://www.cnblogs.com/xiandedanteng中所有博文的标题

    代码: # 列出http://www.cnblogs.com/xiandedanteng中所有博文的标题 from bs4 import BeautifulSoup import requests u ...

  8. 【转载】JavaScript导出Excel

    [转载]JavaScript导出Excel 原文地址 如果没有用到前端插件,也没有用到后台poi导出的话,用js导出也是一种方式.亲测可用. /** * 导出excel */ var idTmr; f ...

  9. 【Python②】python之首秀

       第一个python程序 再次说明:后面所有代码均为Python 3.3.2版本(运行环境:Windows7)编写. 安装配置好python后,我们先来写第一个python程序.打开IDLE (P ...

随机推荐

  1. 各种“地”—— 各种“GND”

    GND,指的是电线接地端的简写.代表地线或0线. 电路图上和电路板上的GND(Ground)代表地线或0线.GND就是公共端的意思,也可以说是地,但这个地并不是真正意义上的地.是出于应用而假设的一个地 ...

  2. QBXT Day2主要是数据结构(没写完先占坑)

    简单数据结构 本节课可能用到的一些复杂度: O(log n). 1/1+1/1/.....1/N+O(n log n) 在我们初学OI的时候,总会遇到这么一道题. 给出N次操作,每次加入一个数,或者询 ...

  3. POJ--2104 K-th Number (主席树模版题)

    题目链接 求区间第k大 #include<iostream> #include<cstring> #include<algorithm> #include<v ...

  4. mysql查看正在执行的sql语句

    有2个方法: 1.使用processlist,但是有个弊端,就是只能查看正在执行的sql语句,对应历史记录,查看不到.好处是不用设置,不会保存. -- use information_schema; ...

  5. css3 media

    @media screen and (max-width: 320px) { .cloud{position:;top: 70%;width: 150px;} .cloud2{;top: 30%;wi ...

  6. 解决python解析文件时输出乱码

    首先获取到json模块,encoding指定文件编码utf-8,errors报错时忽略错误,print()输出结果看看是否有问题. # -*- coding: utf-8 -*- import jso ...

  7. spring cron表达式(定时器)

    转: spring cron表达式(定时器) 写定时器时用到,记录一下: Cron表达式是一个字符串,字符串以5或6个空格隔开,分开工6或7个域,每一个域代表一个含义,Cron有如下两种语法 格式:  ...

  8. 第九节、人脸检测之Haar分类器

    人脸检测属于计算机视觉的范畴,早期人们的主要研究方向是人脸识别,即根据人脸来识别人物的身份,后来在复杂背景下的人脸检测需求越来越大,人脸检测也逐渐作为一个单独的研究方向发展起来. 目前人脸检测的方法主 ...

  9. Centos7安装Mysql5.7方法总结 - 实操手册

    Centos7.x版本下针对Mysql的安装和使用多少跟之前的Centos6之前版本有所不同的,废话就不多赘述了,下面介绍下在centos7.x环境里安装mysql5.7的几种方法:一.yum方式安装 ...

  10. CSS设置边框、符号、背景样式、链接属性

    一.CSS边框空白 padding-top:10px; /*上边框留空白*/ padding-right:10px; /*右边框留空白*/ padding-bottom:10px; /*下边框留空白* ...