【Python3】

之前做的入门练习里有一题将excel文件转化为xml文件,这回补上逆向转换→xml to excel

用的还是beautifulsoup

主要还是:①读取待处理文件文本内容 ②处理文本写入数据到所需格式文件中

原xml文件如下:

<?xml version="1.0"?>
<doc>
<taxML cnName="增值税发票开具明细" xmlns="http://www.chinatax.gov.cn/dataspec/" name="slSbbtjZzsfpkjmxRequest" version="SW5001-2006" xsi:type="slSbbtjZzsfpkjmxRequest" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<sbbZzsfpkjmx>
<head>
<publicHead>
<nsrsbh>440100581884333</nsrsbh>
<nsrmc>广州贝凡信息技术有限公司</nsrmc>
<tbrq>20160801</tbrq>
<sssq>
<rqQ>20160101</rqQ>
<rqZ>20160831</rqZ>
</sssq>
</publicHead>
</head>
<body>
<zyfpkjmx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117808</fphm>
<kprq>20160107 11:16:03</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>1</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117809</fphm>
<kprq>20160107 11:18:54</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>2</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117810</fphm>
<kprq>20160107 11:20:09</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>3</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117811</fphm>
<kprq>20160107 11:22:58</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>142.03</je>
<se>8.52</se>
<zfbz>N</zfbz>
<xh>4</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117812</fphm>
<kprq>20160107 11:24:28</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>5</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117813</fphm>
<kprq>20160107 11:26:07</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>60417.70</je>
<se>3625.06</se>
<zfbz>N</zfbz>
<xh>6</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117814</fphm>
<kprq>20160107 11:32:33</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>7</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117815</fphm>
<kprq>20160107 11:34:30</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>434.35</je>
<se>26.06</se>
<zfbz>N</zfbz>
<xh>8</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117816</fphm>
<kprq>20160107 11:35:54</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>9</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117817</fphm>
<kprq>20160107 11:37:47</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>10</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117818</fphm>
<kprq>20160107 11:39:00</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>11</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117819</fphm>
<kprq>20160107 11:39:53</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>12</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117820</fphm>
<kprq>20160107 11:41:13</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>13</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117821</fphm>
<kprq>20160107 11:42:21</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>14</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117822</fphm>
<kprq>20160107 11:43:38</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>8740.53</je>
<se>524.43</se>
<zfbz>N</zfbz>
<xh>15</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117823</fphm>
<kprq>20160112 12:16:13</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>Y</zfbz>
<xh>16</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117824</fphm>
<kprq>20160112 12:29:19</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>17</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117825</fphm>
<kprq>20160112 12:33:53</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>30428.34</je>
<se>1825.70</se>
<zfbz>N</zfbz>
<xh>18</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117826</fphm>
<kprq>20160113 12:44:58</kprq>
<gmfnsrsbh>441601749182176</gmfnsrsbh>
<je>21650.94</je>
<se>1299.06</se>
<zfbz>N</zfbz>
<xh>19</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117827</fphm>
<kprq>20160129 12:09:48</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>20</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117828</fphm>
<kprq>20160129 12:11:15</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>21</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117829</fphm>
<kprq>20160129 12:12:25</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>22</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117830</fphm>
<kprq>20160129 12:14:05</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>23</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117831</fphm>
<kprq>20160129 12:15:31</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>24</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117832</fphm>
<kprq>20160129 12:16:57</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>25</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117833</fphm>
<kprq>20160129 12:18:07</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>26</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117834</fphm>
<kprq>20160129 12:19:11</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>27</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117835</fphm>
<kprq>20160129 12:20:03</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>28</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>19117836</fphm>
<kprq>20160129 12:20:53</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>29</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199509</fphm>
<kprq>20160129 13:52:10</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>30</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199510</fphm>
<kprq>20160129 13:53:27</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>31</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199511</fphm>
<kprq>20160129 13:54:18</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>32</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199512</fphm>
<kprq>20160129 13:55:24</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>33</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199513</fphm>
<kprq>20160129 13:56:23</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>34</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199514</fphm>
<kprq>20160129 13:58:24</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>35</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199515</fphm>
<kprq>20160129 13:59:39</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>22371.25</je>
<se>1342.27</se>
<zfbz>N</zfbz>
<xh>36</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199516</fphm>
<kprq>20160303 13:49:44</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>15091.66</je>
<se>905.50</se>
<zfbz>N</zfbz>
<xh>37</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199517</fphm>
<kprq>20160303 13:52:13</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>53915.00</je>
<se>3234.90</se>
<zfbz>N</zfbz>
<xh>38</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199518</fphm>
<kprq>20160303 13:54:22</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>39</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199519</fphm>
<kprq>20160303 13:55:30</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>40</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199520</fphm>
<kprq>20160303 13:56:30</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>41</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199521</fphm>
<kprq>20160303 13:57:56</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>42</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199522</fphm>
<kprq>20160303 13:58:48</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>43</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199523</fphm>
<kprq>20160303 14:00:11</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>44</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199524</fphm>
<kprq>20160303 14:02:45</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>45</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199525</fphm>
<kprq>20160303 14:04:04</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>46</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199526</fphm>
<kprq>20160303 14:06:00</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>20448.11</je>
<se>1226.89</se>
<zfbz>N</zfbz>
<xh>47</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199527</fphm>
<kprq>20160307 11:24:32</kprq>
<gmfnsrsbh>110106783995939</gmfnsrsbh>
<je>50283.02</je>
<se>3016.98</se>
<zfbz>Y</zfbz>
<xh>48</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199528</fphm>
<kprq>20160307 11:26:36</kprq>
<gmfnsrsbh>110106783995939</gmfnsrsbh>
<je>51886.79</je>
<se>3113.21</se>
<zfbz>Y</zfbz>
<xh>49</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199529</fphm>
<kprq>20160307 11:35:41</kprq>
<gmfnsrsbh>110106783995939</gmfnsrsbh>
<je>50283.02</je>
<se>3016.98</se>
<zfbz>N</zfbz>
<xh>50</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199530</fphm>
<kprq>20160307 11:36:52</kprq>
<gmfnsrsbh>110106783995939</gmfnsrsbh>
<je>51886.79</je>
<se>3113.21</se>
<zfbz>N</zfbz>
<xh>51</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199531</fphm>
<kprq>20160310 11:39:04</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>84218.44</je>
<se>5053.11</se>
<zfbz>N</zfbz>
<xh>52</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199532</fphm>
<kprq>20160310 17:07:28</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>53</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199533</fphm>
<kprq>20160310 17:12:42</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>23911.56</je>
<se>1434.69</se>
<zfbz>N</zfbz>
<xh>54</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199534</fphm>
<kprq>20160317 17:18:11</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>34106.16</je>
<se>2046.37</se>
<zfbz>N</zfbz>
<xh>55</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199535</fphm>
<kprq>20160321 11:58:10</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>465.58</je>
<se>27.94</se>
<zfbz>N</zfbz>
<xh>56</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199536</fphm>
<kprq>20160412 11:44:03</kprq>
<gmfnsrsbh>441601749182176</gmfnsrsbh>
<je>21650.94</je>
<se>1299.06</se>
<zfbz>N</zfbz>
<xh>57</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199537</fphm>
<kprq>20160412 11:46:11</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>58</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24199538</fphm>
<kprq>20160412 11:48:16</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>26140.43</je>
<se>1568.43</se>
<zfbz>N</zfbz>
<xh>59</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947256</fphm>
<kprq>20160425 16:05:03</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>60</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947257</fphm>
<kprq>20160425 16:07:05</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>7281.89</je>
<se>436.91</se>
<zfbz>N</zfbz>
<xh>61</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947258</fphm>
<kprq>20160426 17:33:48</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>56935.85</je>
<se>3416.15</se>
<zfbz>N</zfbz>
<xh>62</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947259</fphm>
<kprq>20160607 13:33:45</kprq>
<gmfnsrsbh>91440000190351003U</gmfnsrsbh>
<je>97087.38</je>
<se>2912.62</se>
<zfbz>Y</zfbz>
<xh>63</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947260</fphm>
<kprq>20160607 13:40:27</kprq>
<gmfnsrsbh>91440000190351003U</gmfnsrsbh>
<je>19911.46</je>
<se>597.34</se>
<zfbz>Y</zfbz>
<xh>64</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947261</fphm>
<kprq>20160607 17:14:14</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>65</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947262</fphm>
<kprq>20160607 17:18:44</kprq>
<gmfnsrsbh>31022869575617X</gmfnsrsbh>
<je>6091.66</je>
<se>365.50</se>
<zfbz>N</zfbz>
<xh>66</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947263</fphm>
<kprq>20160607 17:36:18</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>76950.19</je>
<se>4617.01</se>
<zfbz>N</zfbz>
<xh>67</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947264</fphm>
<kprq>20160607 17:37:46</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>68</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947265</fphm>
<kprq>20160607 17:39:49</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>69</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947266</fphm>
<kprq>20160607 17:41:03</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>70</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947267</fphm>
<kprq>20160607 17:42:28</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>71</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947268</fphm>
<kprq>20160607 17:43:23</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>72</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947269</fphm>
<kprq>20160607 17:46:36</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>44303.26</je>
<se>2658.20</se>
<zfbz>N</zfbz>
<xh>73</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947270</fphm>
<kprq>20160608 12:56:10</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>74</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947271</fphm>
<kprq>20160608 12:57:43</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>75</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947272</fphm>
<kprq>20160608 12:59:23</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>65097.55</je>
<se>3905.85</se>
<zfbz>N</zfbz>
<xh>76</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947273</fphm>
<kprq>20160616 17:36:20</kprq>
<gmfnsrsbh>91440000190351003U</gmfnsrsbh>
<je>97087.38</je>
<se>2912.62</se>
<zfbz>N</zfbz>
<xh>77</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947274</fphm>
<kprq>20160616 17:41:26</kprq>
<gmfnsrsbh>91440000190351003U</gmfnsrsbh>
<je>19911.46</je>
<se>597.34</se>
<zfbz>N</zfbz>
<xh>78</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947275</fphm>
<kprq>20160622 11:52:50</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>18955.47</je>
<se>1137.33</se>
<zfbz>N</zfbz>
<xh>79</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947276</fphm>
<kprq>20160623 12:55:56</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>80052.88</je>
<se>4803.17</se>
<zfbz>N</zfbz>
<xh>80</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947277</fphm>
<kprq>20160623 17:18:44</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>81</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947278</fphm>
<kprq>20160623 17:22:32</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>48811.51</je>
<se>2928.69</se>
<zfbz>N</zfbz>
<xh>82</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947279</fphm>
<kprq>20160630 11:44:56</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>94339.62</je>
<se>5660.38</se>
<zfbz>N</zfbz>
<xh>83</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947280</fphm>
<kprq>20160630 11:46:32</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>7771.70</je>
<se>466.30</se>
<zfbz>N</zfbz>
<xh>84</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947281</fphm>
<kprq>20160706 17:13:12</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>7253.25</je>
<se>435.19</se>
<zfbz>Y</zfbz>
<xh>85</xh>
</mxxx>
<mxxx>
<fpdm>4400153130</fpdm>
<fphm>24947282</fphm>
<kprq>20160706 17:21:08</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>7253.25</je>
<se>435.19</se>
<zfbz>N</zfbz>
<xh>86</xh>
</mxxx>
<mxxx>
<fpdm>4400154130</fpdm>
<fphm>10394896</fphm>
<kprq>20160713 11:53:26</kprq>
<gmfnsrsbh>441601749182176</gmfnsrsbh>
<je>21650.94</je>
<se>1299.06</se>
<zfbz>Y</zfbz>
<xh>87</xh>
</mxxx>
<mxxx>
<fpdm>4400154130</fpdm>
<fphm>10394897</fphm>
<kprq>20160714 11:53:23</kprq>
<gmfnsrsbh>320111790421052</gmfnsrsbh>
<je>71216.98</je>
<se>4273.02</se>
<zfbz>N</zfbz>
<xh>88</xh>
</mxxx>
<mxxx>
<fpdm>4400154130</fpdm>
<fphm>10394898</fphm>
<kprq>20160720 10:58:42</kprq>
<gmfnsrsbh>440106749182803</gmfnsrsbh>
<je>13698.11</je>
<se>821.89</se>
<zfbz>N</zfbz>
<xh>89</xh>
</mxxx>
<mxxx>
<fpdm>4400154130</fpdm>
<fphm>10394899</fphm>
<kprq>20160728 12:25:07</kprq>
<gmfnsrsbh>914416027491821765</gmfnsrsbh>
<je>21650.94</je>
<se>1299.06</se>
<zfbz>N</zfbz>
<xh>90</xh>
</mxxx>
</zyfpkjmx>
<zyfpkjhjxx>
<zyfpkjhjs>90</zyfpkjhjs>
<zzszyfphjJe>6134426.75</zzszyfphjJe>
<zzszyfphjSe>361045.81</zzszyfphjSe>
</zyfpkjhjxx>
<ptfpkjmx />
<ptfpkjhjxx>
<ptfpkjhjs>0</ptfpkjhjs>
<ptfpkjhjJe>0</ptfpkjhjJe>
<ptfpkjhjSe>0</ptfpkjhjSe>
</ptfpkjhjxx>
</body>
</sbbZzsfpkjmx>
</taxML>
<doc>

目标是将以下标签内内容提取成列表格式:

          <fpdm>...</fpdm>
<fphm>...</fphm>
<kprq>...</kprq>
<gmfnsrsbh>...</gmfnsrsbh>
<je>...</je>
<se>...</se>
<zfbz>...</zfbz>
<xh>...<z/xh>

Code(粗糙应用版):

from bs4 import BeautifulSoup
import xlwt with open('cww.xml', 'r') as f:
xml_doc =f.read() #读取xml文本内容 soup = BeautifulSoup(xml_doc, 'html.parser')
keyword = ['fpdm','fphm','kprq','gmfnsrsbh','je','se','zfbz','xh'] #关键词list datatable = xlwt.Workbook(encoding='utf-8', style_compression=0)
newsheet = datatable.add_sheet('mxxx', cell_overwrite_ok=True) #新建excel文档sheet num = 0 #列 for i in range(len(keyword)):
newsheet.write(0, num, keyword[i]) #写入每列keyword
info_list = []
for se in soup.find_all(keyword[i]):
info = se.get_text()
info_list.append(info) #找出所有对应标签内的text组成list
print(info_list)
for i in range(len(info_list)):
newsheet.write(i+1, num, info_list[i]) #将该list中数据以列写入excel表
num += 1 #列数加一,继续遍历关键词写入excel表格 datatable.save('liez.xls')

整理结果如图:

【待续】

【Python】Xml To Excel的更多相关文章

  1. 【Python】xml 解析

    1. XML:指可扩展标记语言,是一种标记语言,用于存储数据和传输数据,但没有像HTML那样具有预定义标签,需要程序猿自定义标签 2. XML的解析:读取XML数据结构中的某些信息,比如读取书的属性 ...

  2. 【Python】实现将Excel编写的用例上传到testlink指定用例集

    背景 百科上说TestLink 是基于web的测试用例管理系统,主要功能是测试用例的创建.管理和执行,并且还提供了一些简单的统计功能.其他的信息可以参照他们的官网http://www.testlink ...

  3. 【Python】 xml转json

    虽然python有解析xml的模块,也有生成json的模块,但是没有把这两者连接起来的模块. 下面是以来自MIT的大神Martin Blech写的一个方便的模块,供大家参考.也别忘了在用之前先拜谢作者 ...

  4. 【Python】 xml解析与生成 xml

    xml *之前用的时候也没想到..其实用BeautifulSoup就可以解析xml啊..因为html只是xml的一种实现方式吧.但是很蛋疼的一点就是,bs不提供获取对象的方法,其find大多获取的都是 ...

  5. 【Python】xml遍历练习

      <?xml version="1.0" encoding="utf-8" ?> <!--this is a test about xml. ...

  6. 【原创】.NET读写Excel工具Spire.Xls使用(1)入门介绍

    在.NET平台,操作Excel文件是一个非常常用的需求,目前比较常规的方法有以下几种: 1.Office Com组件的方式:这个方式非常累人,微软的东西总是这么的复杂,使用起来可能非常不便,需要安装E ...

  7. 【python】列出http://www.cnblogs.com/xiandedanteng中所有博文的标题

    代码: # 列出http://www.cnblogs.com/xiandedanteng中所有博文的标题 from bs4 import BeautifulSoup import requests u ...

  8. 【转载】JavaScript导出Excel

    [转载]JavaScript导出Excel 原文地址 如果没有用到前端插件,也没有用到后台poi导出的话,用js导出也是一种方式.亲测可用. /** * 导出excel */ var idTmr; f ...

  9. 【Python②】python之首秀

       第一个python程序 再次说明:后面所有代码均为Python 3.3.2版本(运行环境:Windows7)编写. 安装配置好python后,我们先来写第一个python程序.打开IDLE (P ...

随机推荐

  1. [CTSC2012]熟悉的文章(后缀自动机+动态规划)

    题目描述 阿米巴是小强的好朋友. 在小强眼中,阿米巴是一个作文成绩很高的文艺青年.为了获取考试作文的真谛,小强向阿米巴求教.阿米巴给小强展示了几篇作文,小强觉得这些文章怎么看怎么觉得熟悉,仿佛是某些范 ...

  2. centos7下利用httpd2.4配置svn并使用Ldap用户认证

    应用场景:Windows下有AD活动目录,类Unix系统下有Ldap,在运维开发工具平台逐步丰富的现在,统一用户管理大大便捷了管理人员. 其中不乏经典版本控制管理工具svn,与Ldap组合的用户认证方 ...

  3. 20165223 结对编程之四则运算week2-整体总结

    目录 一.结对对象 二.需求分析 三.设计思路 四.核心代码 五.功能截图 六.结对感受 一.结对对象 担任角色(本周交换角色,流动学习) 驾驶员(Driver):20165218 赵冰雨(是控制键盘 ...

  4. 20165223 学习基础和C语言基础调查

    一.学习基础 1. 我所擅长的技能 从小我就对新鲜事物抱有浓厚的兴趣,因此多年来培养了许多爱好,对感兴趣的诸如绘画方面的国画.油画.素描.漫画等:音乐方面的钢琴.吉他.架子鼓等:运动方面的滑板.溜冰. ...

  5. CodeFroces-- 514.div2.C-Sequence Transformation

    题目链接 :514.div2.C-Sequence Transformation #include<bits/stdc++.h> using namespace std; #define ...

  6. kafaka quickstart

    http://kafka.apache.org/ http://kafka.apache.org/downloads cd /root/kafuka/kafka_2.12-0.11.0.0 nohup ...

  7. 英语动画字母积木 Alphablocks 4季91集 自然拼读phonics 带字幕

    BBC Cbeebies的Alphablocks声情并茂,是让孩子接触phonics自然拼读并产生拼读意识的一系列非常不错的动画片.跳跳蛙字母工厂Leap Frog_Letter Factory是美国 ...

  8. java 数组声明定义 数组内存分配 数组初始化 数组引用 数组的遍历

    一,数组的定义 Java 中定义数组的语法有两种: 1. type arrayName[]; 2. type[] arrayName;type 为Java中的任意数据类型,包括基本类型和组合类型,ar ...

  9. SpaceVim中vimproc的vimproc_linux64.so未找到

    vimproc是我使用的SpaceVim中自动安装的插件,在启动时出现了"找不到dll文件"的提示,通过查阅官网( https://github.com/Shougo/vimpro ...

  10. How MVC pattern Flows

    以上MVC流程中Model和View不存在依赖关系 以上MVC流程View和Model存在耦合关系(依赖关系越少越好)