给统计人讲python（1）模拟城市

为让学校统计学社的同学了解python在数据处理方面的功能，将手游模拟城市的工厂生产进行建模，让同学在建模与处理非结构数据的过程中学习和了解python。将准备的内容放在此让更多需要的人特别是统计人（准备时是按照统计学生的平时会遇到的问题准备的）学习。

首先是模拟城市这款手游

它的一个非常令人头秃之处是等级高时非常缺金币，而要在游戏内获取基本只能通过生产商品并出售。我们要做的是分析可以生产的商品，计算生产每种商品增加值以及结合各生产部门生产能力寻找出单位时间内能生产出价值最高的产品组合。

一、基本分析

我们所有的讨论都是基于这个游戏等级为10级的情况。十级时共有5个生产部门，包括工厂（生产原材料如：铁、木、塑料等）、材料厂、工具厂、家具厂、农贸厂。每个部门生产的产品都需要耗费时间都有一定的价格，除了工厂生产的原材料其他部门生产的产品都需要原料合成，于是，我们可以得到这些部门生产产品的基本信息（在实际经济的核算中我们也会得到各种不同形式的原始数据，一下面的表格为例进行分析）。

工厂：生产铁、木头、塑料、和种子

材料厂：生产木板和钉子，他们分别消耗两个木头和两个铁

材料厂：生产榔头、卷尺和铲子

家具厂：生产椅子，需耗费两个木头、一个榔头和一个钉子

农贸厂：生产果蔬需耗费两个种子

数据很少很简单，但处理这种广义表结构的数据值得我们练习

二、计算所有产品增加值

#导入pandas和numpy包，这两个包是数据处理最常用的包

import pandas as pd

import numpy as np

#构建字典来存储不同部门生产的不同商品每个商品都含有三个属性：价格、耗费时间、组成成分

'''rooms={'instrum':{'hammer':{'price':450,'time':1,'compon':['Fe','wood']}},

       'materl':{'nail':{'price':400,'time':2,'compon':['Fe','Fe']}},

       'elem':{'Fe':{'price':50,'time':3,'compon':[]},'wood':{'price':1,'time':1,'compon':[]},'seed':

           {'price':1,'time':1,'compon':[]}}}

我们需要把excel中的数据转化成这种字典

'''

#每个部门的数据被存储在excel的一个sheet中，read_excel的sheet参数取None得到一个panel其键为sheet名。

data=pd.read_excel('result.xls',None)

rooms={}

for sheet in data.keys():

    print(sheet)

    df=pd.read_excel('result.xls',sheet,index_col =0)

    tools={}

    for name in df.columns:

        labels={}

        for idx in df.index:

            if idx=='compon':

                try:

                    labels[idx]=df[name][idx].split(',')

                    print(labels[idx])

                except:

                    labels[idx]=['nan']

            else:

                labels[idx]=df[name][idx]

        tools[name]=labels

    rooms[sheet]=tools

#为方面我们后面使用，创建一个字典存放产品是属于哪个部门的

fromdic={}

for i in rooms:

    for j in rooms[i]:

        fromdic[str(j)]=i

#计算各产品增加值，得到一个以产品名为主码属性包含增加值的表

df={}

time,price,add,name=[],[],[],[]

room1,room2,room3,room4,room5=[],[],[],[],[]

for room in rooms:

    for tools in rooms[room]:

        toolsdic=rooms[room][tools]

        for i in rooms:

            occdic[i] = 0

        time.append(rooms[room][tools]['time'])

        price.append(rooms[room][tools]['price'])

        sump=[]

        occdic[fromdic[tools]] = rooms[room][tools]['time']

        if tools not in rooms['factory']:

            add.append(rooms[room][tools]['price']-np.sum([rooms[fromdic[i]][i]['price'] for i in rooms[room][tools]['compon']]))

            for comp in rooms[room][tools]['compon']:

                occdic[fromdic[comp]] += rooms[fromdic[comp]][comp]['time']

                if comp in rooms['factory']:

                    pass

                else:

                    for i in rooms[fromdic[comp]][comp]['compon']:

                        occdic[fromdic[i]] += rooms[fromdic[i]][i]['time']

        else:

            add.append(rooms[room][tools]['price']-0)

        name.append(str(tools))

df['time']=time

df['price']=price

df['addition'] = add

df['name']=name

三、计算生产每种商品的收益和成本（cost）
    我们的目的是找出单位时间内赚金币最快的生产组合，可以思考一下当我们生产椅子时耗费了什么。首先需要占据椅子店一定的时间，然后要耗费一个锤子、一个钉子和两个木头，每生产一个椅子我们其实必须生产一个锤子、一个钉子和两个木头。
所以我们可以把椅子分解为一个抽象的家具A加它的组成产品（家具A没有组成材料且价格为椅子增加值，生产家具A要且只要耗费家具厂生产一个椅子的时间），那么我们生产的椅子其实是一个产品集合即{锤子,钉子,2*木头,家具A}。我们生产锤子和钉子又分别耗费工具店的一定时间、一木一铁和材料店的一定时间、两铁，
我们又可以把锤子和钉子分别分解为{工具A，木头，铁}{材料A，2*铁}，其中工具A是抽象的工具不耗费材料价格为锤子的增加值且生产它要耗费工具厂生产一个锤子的时间。最后我们可以把铁、木头等价表示为{工厂A、工厂B}生产他们分别要耗费工厂生产一个铁和一个木头的时间。那么椅子就可以分解为集合{工具A,材料A,家具A,3*工厂A,3*工厂B},集合中给工具A、材料A、家具A表示生产椅子实质会占用这三个部门生产时间。
于是我们可以把每种产品都写成它占据各部门时间的集合。

occdic={}

for i in rooms:

    occdic[i]=0

df=pd.DataFrame(df)

df={}

time,price,add,name=[],[],[],[]

room1,room2,room3,room4,room5=[],[],[],[],[]

for room in rooms:

    for tools in rooms[room]:

        toolsdic=rooms[room][tools]

        for i in rooms:

            occdic[i] = 0

        time.append(rooms[room][tools]['time'])#此处先记直接占用部门的时间

        price.append(rooms[room][tools]['price'])

        sump=[]

        occdic[fromdic[tools]] = rooms[room][tools]['time']

        if tools not in rooms['factory']:

            for comp in rooms[room][tools]['compon']:

                occdic[fromdic[comp]] += rooms[fromdic[comp]][comp]['time']#此处记录间接占用部门的时间

                if comp in rooms['factory']:

                    pass

                else:

                    for i in rooms[fromdic[comp]][comp]['compon']:

                        occdic[fromdic[i]] += rooms[fromdic[i]][i]['time']

        name.append(str(tools))

        room1.append(occdic['instrum'])

        room2.append(occdic['metrl'])

        room3.append(occdic['factory'])

        room4.append(occdic['vegatable'])

        room5.append(occdic['furnit'])

df['time']=time

df['price']=price

df['name']=name

df['instrum']=room1

df['metrl']=room2

df['factory']=room3

df['vegatable']=room4

df['furnit']=room5

四、总结
最终我们得到了一个含有各种产品增加值、占用各部门时间的数据框。

有了这个数据框我们就可以根据提炼出的信息寻优找到在给定部门使用时间内生产总值最大的产品组合。因为这个问题本质是一个限制条件下求极大值问题，对于真实情况我们可以选择各种算法比如遗传算法、随机森林、神经网络等等，当然对于我们这个小规模的问题甚至可以枚举选出收益最大的组合。

　　所以本文主要是对不那么结构化的数据进行处理是我们后面的数据分析更加方便简单，希望对学习用python做数据分析的人有帮助。

PS：最后在本人博客的文件中附上本次用到的数据供大家联系，文件名为simcity.zip。

给统计人讲python（1）模拟城市_数据分析的更多相关文章

给统计人讲Python（1）_科学计算库-Numpy
本地代码是.ipynb格式的转换到博客上很麻烦,这里展示部分代码,了解更多可以查看我的git-hub:https://github.com/Yangami/Python-for-Statisticia ...
python爬虫22 | 以后我再讲python「模拟登录」我就是狗
接下来就是学习python的正确姿势做爬虫绕不开模拟登录为此小帅b给大家支了几招 python爬虫19 | 遇到需要的登录的网站怎么办?用这3招轻松搞定! 有些网站的登录很弱鸡传个用户名和密 ...
使用python实现模拟掷骰子数据分析
Data:2020/4/8 主题:模拟实现掷骰子数据分析编译环境:pycharm 库:pygal 说明: code 1:创建一个掷骰子类对象,类方法获得掷骰子随机数1-6,默认6个面,模拟20次将结 ...
用python实现模拟登录人人网
用python实现模拟登录人人网字数4068 阅读1762 评论19 喜欢46 我决定从头说起.懂的人可以快速略过前面理论看最后几张图. web基础知识从OSI参考模型(从低到高:物理层,数据链路 ...
python学习第八讲,python中的数据类型,列表,元祖,字典,之字典使用与介绍
目录 python学习第八讲,python中的数据类型,列表,元祖,字典,之字典使用与介绍.md 一丶字典 1.字典的定义 2.字典的使用. 3.字典的常用方法. python学习第八讲,python ...
python学习第六讲,python中的数据类型,列表,元祖,字典,之列表使用与介绍
目录 python学习第六讲,python中的数据类型,列表,元祖,字典,之列表使用与介绍. 二丶列表,其它语言称为数组 1.列表的定义,以及语法 2.列表的使用,以及常用方法. 3.列表的常用操作 ...
python学习第四讲,python基础语法之判断语句,循环语句
目录 python学习第四讲,python基础语法之判断语句,选择语句,循环语句一丶判断语句 if 1.if 语法 2. if else 语法 3. if 进阶 if elif else 二丶运算符 ...
【爬虫】python requests模拟登录知乎
需求:模拟登录知乎,因为知乎首页需要登录才可以查看,所以想爬知乎上的内容首先需要登录,那么问题来了,怎么用python进行模拟登录以及会遇到哪些问题? 前期准备: 环境:ubuntu,python2. ...
Python requests模拟登录
Python requests模拟登录 #!/usr/bin/env python # encoding: UTF-8 import json import requests # 跟urllib,ur ...

随机推荐

C#中List按特定字段排序
有一个类,如Student,有学号.数学成绩.语文成绩, 存在List列表中,要将List按数学成绩排序,怎么办呢? List<Student> scores=GetScores(); s ...
SSO+PHS 同步问题修正解决
参照URL: https://blogs.technet.microsoft.com/latam/2018/03/27/using-the-consistencyguid/ https://chinn ...
「Mobile Testing Summit China 2017」第三届中国移动互联网测试开发大会-讲师征集
时至北京盛夏,一场由 TesterHome 主办的关于移动互联网测试技术的盛会正在紧锣密鼓的筹备中.只要你关注软件质量,热爱测试,期待学习,都欢迎你加入这次移动测试技术大会中和我们一起分享经验.探讨话 ...
图片支持get请求访问
BufferedInputStream in = new BufferedInputStream(doc2.getContent());//读取文件到输入流 OutputStream out = re ...
whil
while true; do select input in cpu_load disk_load disk_use disk_inode mem_use tcp_status cpu_top10 m ...
asp微信支付代码v4.1无需证书版,带回调入库的asp支付源码
昨天帮一个客户写的,他的程序是老的asp,想实现微信在手机上下单付款,让帮忙给写一份asp微信支付的接口代码,昨天晚上闲着没事,搞了一个晚上才搞好,其实asp支付并不需要安装证书,其实asp支付也很好 ...
IDEA开发环境配置
1.JDK 2.Maven 3.Tomcat 当找不到 Artifacts , 可以查看一下: 4.配置 terminal 为 git 终端 5.MySQL 6.文件服务器 7.配置 mybatis
RobotFramework - AppiumLibrary 之关键字Open Application使用
初见Hadoop—- 搭建MyEclipse 访问HDFS 上的文件
因公司项目需要,开始接触大数据分析这块知识.网上关于大数据这块的知识还是比较多的.学习了一个礼拜了,再次记录一下,自己的学习过程,希望可以帮助后学者少走一些弯路. 服务端的配置,由于公司项目经理已经配 ...
Javascript面向对象编程（二）
子承父业该方法利用了call,apply,按照原有的方式进行复制,做一些改进,最后进行事务处理.废话不多说,直接看例子. 在这里我提一下,call和apply的异同:它们两个都可以改变this指向, ...

给统计人讲python（1）模拟城市_数据分析

给统计人讲python（1）模拟城市_数据分析的更多相关文章

随机推荐

热门专题