JsonSchema

使用fastjsonschema来校验数据



# 导入验证器

import json

import fastjsonschema

# 读取schema

with open('../schema/oneof-schema.json', encoding='utf8') as f:

    my_schema = json.load(f)

# json数据：

with open('../data/test.json', encoding='utf8') as f:

    json_data = json.load(f)

# 验证：

fastjsonschema.validate(my_schema, json_data)

使用jsonschema来校验数据



import json

# 导入验证器

from jsonschema import validate, draft7_format_checker, SchemaError, ValidationError

if __name__ == '__main__':

    with open('../schema/MySchema.json', encoding='utf8') as f:

        my_schema = json.load(f)

    # json数据：

    with open('../data/cece.json', encoding='utf8') as f:

        json_data = json.load(f)

    # error_list = check_type(my_schema, json_data)

    # print(error_list)

    # 验证：

    try:

        validate(instance=json_data, schema=my_schema, format_checker=draft7_format_checker)

        # Draft7Validator.format_checker

    except SchemaError as serr:

        print("schema 错误 【%s】 \nschema错误" % str(serr))

    except ValidationError as verr:

        print("数据 错误 【%s】 \n数据错误" % str(verr))

MySchema

JSONSchema缺点

错误提示英文

校验数据为一步步校验，遇到错误停止

自定义JSONSchema

schema遵循 http://json-schema.org/，

"$schema": "http://json-schema.org/draft-07/schema#",

使用方法 >>>> 点击这里

代码

个人编写的校验的代码，自定义成分较多

目前仅仅扩展了 string类型的数据 format 的选型判断

CheckDataUti.py



import re

import time

# email 正则表达式

EMAIL_REGEX = "^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$"

# URL 正则表达式

URL_REGEX = "^[a-zA-z]+://[^\s]*$"

# PHONE 正则表达式

PHONE_REGEX = "^([1][3,4,5,6,7,8,9])\d{9}$"

# 身份证 正则表达式

ID_CARD_REGEX = "^((\d{18})|([0-9x]{18})|([0-9X]{18}))$"

# 邮政编码 正则表达式

ZIP_CODE_REGEX = "^[1-9]\d{5}(?!\d)$"

# IP 地址 正则表达式

IP_REGEX = "^\d+\.\d+\.\d+\.\d+$"

# 正整数

INTEGER_REGEX = "^[1-9]\d*$"

ERR_LIST = []

COMMON_ERR_LIST = []

def log_error(msg, data, schema, is_common=False):

    """

    打印错误日志

    """

    err_log = "%s,数据:【%s】,校验规则: %s" % (str(msg), str(data) + " type of " + str(type(data).__name__), str(schema))

    if not is_common:

        ERR_LIST.append(err_log)

        print("=================================================")

        print(err_log)

        print("=================================================")

    else:

        COMMON_ERR_LIST.append(err_log)

def check_object(data, schema, is_common):

    """

    校验对象格式

    【 properties、required、minProperties、maxProperties、patternProperties、additionalProperties 】

    """

    if type(data) != dict:

        log_error("当前校验的json不是一个对象格式", data, schema, is_common)

    else:

        # 获取当前校验数据的所有key

        keys = dict.keys(data)

        # 处理必需值

        if "required" in schema:

            required_schema = schema['required']

            for schema_key in required_schema:

                if schema_key not in keys:

                    log_error("字段【%s】必填" % schema_key, data, schema, is_common)

        # 处理最小key和最大key

        if "minProperties" in schema:

            min_properties = schema['minProperties']

            if len(keys) < min_properties:

                log_error("校验数据的key个数小于【%s】" % str(min_properties), data, schema, is_common)

        if "maxProperties" in schema:

            max_properties = schema['maxProperties']

            if len(keys) > max_properties:

                log_error("校验数据的key个数大于【%s】" % str(max_properties), data, schema, is_common)

        # 处理具体的key

        if "properties" in schema:

            # 处理 properties

            properties_schema = schema['properties']

            schema_keys = dict.keys(properties_schema)

            for data_key in schema_keys:

                if data_key in data:

                    check_data(properties_schema[data_key], data[data_key])

        # 处理满足正则表达式的key

        if "patternProperties" in schema:

            # 处理 properties

            pattern_properties = schema['patternProperties']

            schema_keys = dict.keys(pattern_properties)

            # 循环所有正则表达式的key

            for schema_key in schema_keys:

                # 循环当前待校验的数据key

                for data_key in keys:

                    # 仅仅处理满足正则表达式的key数据

                    if re.match(schema_key, data_key):

                        check_data(pattern_properties[schema_key], data[data_key])

def check_array(data, schema, is_common):

    """

    校验数组格式

    【 items、additionalItems、minItems、maxItems、uniqueItems 】

    """

    if type(data) != list:

        log_error("当前校验的json不是数组格式", data, schema, is_common)

    else:

        # minItems、maxItems

        # 判断最小值

        if "minItems" in schema:

            min_items = schema['minItems']

            if len(data) < min_items:

                log_error("当前校验的数据数组长度小于【%s】" % str(min_items), data, schema, is_common)

        # 判断最大值

        if "maxItems" in schema:

            max_properties = schema['maxItems']

            if len(data) > max_properties:

                log_error("当前校验的数据数组长度大于【%s】" % str(max_properties), data, schema, is_common)

        # uniqueItems true 数组元素不能重复

        if "uniqueItems" in schema:

            unique_items_schema = schema['uniqueItems']

            if unique_items_schema:

                # 数组元素不能重复

                try:

                    if len(set(data)) != len(data):

                        log_error("当前校验的数据数组元素不能重复", data, schema, is_common)

                except TypeError:

                    # 存在数组内部元素是dict格式

                    pass

        # 判断每一个items

        if "items" in schema:

            items_schema = schema["items"]

            # 判断items_schema 是数组还是对象

            if type(items_schema) is list:

                # 如果是数组 每一个item都是一个jsonSchema 索引对应的数组内索引的格式

                index = 0

                for item_sc in items_schema:

                    check_data(item_sc, data[index])

                    index += 1

                # additionalItems该关键字只有在items是数组的时候才会有效

                # additionalItems 除了上述规定之外的数据必需符合指定的规则

                if "additionalItems" in schema:

                    additional_items_schema = schema['additionalItems']

                    for i in range(index, len(data)):

                        check_data(additional_items_schema, data[i])

            # items如果是对象  当前schema规范了数组内所有元素的格式

            elif type(items_schema) is dict:

                for item_data in data:

                    check_data(items_schema, item_data)

def check_number(data, schema, is_common):

    """

    校验数字类型

    """

    if type(data) not in (int, float):

        log_error("当前校验的json不是一个数字格式", data, schema, is_common)

    else:

        # 判断最大值 maximum 如果exclusiveMaximum该关键字是True 包含本身

        if "maximum" in schema:

            maximum_schema = schema['maximum']

            if 'exclusiveMaximum' in schema and schema['exclusiveMaximum']:

                if data >= maximum_schema:

                    log_error("当前校验的数据大于等于【%s】" % maximum_schema, data, schema, is_common)

            else:

                if data > maximum_schema:

                    log_error("当前校验的数据大于【%s】" % maximum_schema, data, schema, is_common)

        # minimum、exclusiveMinimum

        if "minimum" in schema:

            minimum_schema = schema['minimum']

            if 'exclusiveMinimum' in schema and schema['exclusiveMinimum']:

                if data <= minimum_schema:

                    log_error("当前校验的数据小于等于【%s】" % minimum_schema, data, schema, is_common)

            else:

                if data < minimum_schema:

                    log_error("当前校验的数据小于【%s】" % minimum_schema, data, schema, is_common)

        # multipleOf    整除

        if "multipleOf" in schema:

            multiple_of_schema = schema['multipleOf']

            if not data % multiple_of_schema == 0:

                log_error("当前校验的数据不能被%s整除" % multiple_of_schema, data, schema, is_common)

def check_str(data, schema, is_common):

    """

    校验字符串类型

    涉及的关键字 【maxLength、minLength、pattern、format】

    """

    if type(data) != str:

        log_error("当前校验的数据不是一个字符串格式", data, schema, is_common)

    else:

        # maxLength

        if "maxLength" in schema:

            max_length_schema = schema['maxLength']

            if len(data) > max_length_schema:

                log_error("当前校验的数据长度大于%d" % max_length_schema, data, schema, is_common)

        # minLength

        if "minLength" in schema:

            min_length_schema = schema['minLength']

            if len(data) < min_length_schema:

                log_error("当前校验的数据长度小于%d" % min_length_schema, data, schema, is_common)

        # pattern

        if "pattern" in schema:

            pattern_schema = schema['pattern']

            if not re.match(pattern_schema, data):

                log_error("当前校验的数据不符合正则表达式规则【%s】" % pattern_schema, data, schema, is_common)

        # format

        if 'format' in schema:

            format_schema = schema['format']

            if format_schema == 'email' and not re.match(EMAIL_REGEX, data):

                log_error("当前校验的数据不是正确的邮箱格式", data, schema, is_common)

            elif format_schema == 'phone' and not re.match(PHONE_REGEX, data):

                log_error("当前校验的数据不是正确的手机号码格式", data, schema, is_common)

            elif format_schema == 'hostname' and not re.match(IP_REGEX, data):

                log_error("当前校验的数据不是正确的IP地址格式", data, schema, is_common)

            elif format_schema == 'idCard' and not re.match(ID_CARD_REGEX, data):

                log_error("当前校验的数据不是正确的身份证格式", data, schema, is_common)

            elif format_schema == 'date':

                format_patten = '%Y-%m-%d'

                if 'format_patten' in schema:

                    format_patten = schema['format_patten']

                try:

                    time.strptime(data, format_patten)

                except ValueError:

                    log_error("当前校验的数据不是正确的日期格式格式【%s】" % format_patten, data, schema, is_common)

def check_common(schema, data):

    """

    校验通用的

    涉及到关键字：

    【 enum、const、allOf、anyOf、oneOf、not、 if……then…… 】

    """

    if "enum" in schema:

        enum_schema = schema['enum']

        if data not in enum_schema:

            log_error("当前校验的数据值不存在【%s】中" % str(enum_schema), data, schema)

    if "const" in schema:

        const_schema = schema['const']

        if data != const_schema:

            log_error("当前校验数据值不等于【%s】" % str(const_schema), data, schema)

    if "allOf" in schema:

        all_of_schema = schema['allOf']

        for item_schema in all_of_schema:

            check_data(item_schema, data)

    if "anyOf" in schema:

        any_of_schema = schema['anyOf']

        begin_len = len(COMMON_ERR_LIST)

        for item_schema in any_of_schema:

            check_data(item_schema, data, True)

        end_len = len(COMMON_ERR_LIST)

        if end_len - begin_len == len(any_of_schema):

            log_error("当前校验的数据不符合当前anyof中的任一规则", data, schema)

    if "oneOf" in schema:

        one_of_schema = schema['oneOf']

        begin_len = len(COMMON_ERR_LIST)

        for item_schema in one_of_schema:

            check_data(item_schema, data, True)

        end_len = len(COMMON_ERR_LIST)

        if end_len - begin_len != len(one_of_schema) - 1:

            log_error("待校验JSON元素不能通过oneOf的校验", data, schema)

    if "not" in schema:

        not_schema = schema['not']

        begin_len = len(COMMON_ERR_LIST)

        check_data(not_schema, data, True)

        end_len = len(COMMON_ERR_LIST)

        if end_len == begin_len:

            log_error("待校验JSON元素不能通过not规则的校验", data, schema)

    # if……then……

    if 'if' in schema:

        if_schmea = schema['if']

        begin_len = len(COMMON_ERR_LIST)

        check_data(if_schmea, data, True)

        end_len = len(COMMON_ERR_LIST)

        if end_len == begin_len:

            if "then" in schema:

                then_schema = schema['then']

                check_data(then_schema, data, False)

        else:

            if "else" in schema:

                else_schema = schema['else']

                check_data(else_schema, data, False)

def get_data_type(data):

    """

    获取type

    """

    if type(data) == dict:

        return 'object'

    if type(data) == list:

        return 'array'

    if type(data) in (int, float):

        return 'number'

    if type(data) == str:

        return 'string'

    if type(data) == bool:

        return 'boolean'

def check_data(schema, data, is_common=False):

    # 优先处理 通用的

    check_common(schema, data)

    # 没有type的情况

    # type 默认为string

    type_name = schema['type'] if "type" in schema else get_data_type(data)

    if type_name == 'object':

        check_object(data, schema, is_common)

    elif type_name == 'array':

        check_array(data, schema, is_common)

    elif type_name in ['integer', 'number']:

        check_number(data, schema, is_common)

    elif type_name == 'string':

        check_str(data, schema, is_common)

    # type是布尔类型

    elif type_name == 'boolean':

        if type(data) != bool:

            log_error("当前校验的数据不是一个boolean格式", data, schema, is_common)

JsonSchmea 的数据示例



{

  "$schema": "http://json-schema.org/draft-07/schema#",

  "type": "object",

  "minProperties": 1,

  "maxProperties": 200,

  "properties": {

    "name": {

      "type": "string",

      "enum": [

        "shaofei",

        "upuptop",

        "pyfysf"

      ]

    },

    "email": {

      "type": "string",

      "format": "email",

      "const": "pyfysf@163.com"

    },

    "idCard": {

      "type": "string",

      "format": "idCard",

      "pattern": "\\d+"

    },

    "phone": {

      "type": "string",

      "format": "phone"

    },

    "hostname": {

      "type": "string",

      "format": "hostname"

    },

    "createTime": {

      "format": "date",

      "format_patten": "%Y%m%d"

    },

    "is": {

      "type": "boolean"

    },

    "age": {

      "type": "integer",

      "maximum": 20,

      "minimum": 1,

      "multipleOf": 2

    },

    "like": {

      "type": "array"

    }

  },

  "allOf": [

    {

      "type": "string"

    }

  ],

  "patternProperties": {

    "^\\S+123$": {

      "type": "integer"

    }

  },

  "required": [

    "email"

  ]

}

使用方式



import json

from CheckDataUti import check_data

if __name__ == '__main__':

    with open('../schema/MySchema.json', encoding='utf8') as f:

        my_schema = json.load(f)

    # json数据：

    with open('../data/cece.json', encoding='utf8') as f:

        json_data = json.load(f)

    check_data(my_schema, json_data)

    # print(ERR_LIST)

参考：

schema遵循 http://json-schema.org/，

"$schema": "http://json-schema.org/draft-07/schema#",

使用方法 >>>> 点击这里

学习了JsonSchema，我自定义了一个校验代码的更多相关文章

JVM学习第一篇思考：一个Java代码是怎么运行起来的-上篇
JVM学习第一篇思考:一个Java代码是怎么运行起来的-上篇作为一个使用Java语言开发的程序员,我们都知道,要想运行Java程序至少需要安装JRE(安装JDK也没问题).我们也知道我们Java程序 ...
JavaScript学习12 JS中定义对象的几种方式
JavaScript学习12 JS中定义对象的几种方式 JavaScript中没有类的概念,只有对象. 在JavaScript中定义对象可以采用以下几种方式: 1.基于已有对象扩充其属性和方法 2.工 ...
JavaScript学习12 JS中定义对象的几种方式【转】
avaScript学习12 JS中定义对象的几种方式转自: http://www.cnblogs.com/mengdd/p/3697255.html JavaScript中没有类的概念,只有对象. ...
SpringMVC学习（三）———— springmvc的数据校验的实现
一.什么是数据校验? 这个比较好理解,就是用来验证客户输入的数据是否合法,比如客户登录时,用户名不能为空,或者不能超出指定长度等要求,这就叫做数据校验. 数据校验分为客户端校验和服务端校验客户端校验 ...
【SpringMVC学习06】SpringMVC中的数据校验
这一篇博文主要总结一下springmvc中对数据的校验.在实际中,通常使用较多是前端的校验,比如页面中js校验,对于安全要求较高的建议在服务端也要进行校验.服务端校验可以是在控制层conroller, ...
selenium webdriver学习（十）------------如何把一个元素拖放到另一个元素里面(转)
selenium webdriver学习(十)------------如何把一个元素拖放到另一个元素里面博客分类: Selenium-webdriver 元素拖放drag and drop Q群里 ...
学习vue就是那么简单，一个简单的案例
vue是前端兴起的一个javascript库,相信大家都使用过jQuery,虽然vue和jQuery没有可比性,但从熟悉的角度去理解新的东西或许会容易接受一些,有时候由于思想和模式的转变会带来阵痛,但 ...
用struts2标签如何从数据库获取数据并在查询页面显示。最近做一个小项目，需要用到struts2标签从数据库查询数据，并且用迭代器iterator标签在查询页面显示，可是一开始，怎么也获取不到数据，想了许久，最后发现，是自己少定义了一个变量，也就是var变量。
最近做一个小项目,需要用到struts2标签从数据库查询数据,并且用迭代器iterator标签在查询页面显示,可是一开始,怎么也获取不到数据,想了许久,最后发现,是自己少定义了一个变量,也就是var变 ...
JAVA学习笔记（一）：一个小爬虫的例子
1.import java.io.*; java.io.*不是一个文件,而是一组类.它是在java.io包里的所有类,*是通配符,比如a*.txt代表的就是以a开头的所有txt文件,“?”是单个词 ...

随机推荐

控制层传递参数到jsp页面，jsp页面进行接收
在java代码中,控制层方法如下(采用model,还有其他方式) public String mysave(MyTreeMould myTreeMould, Model model) {...... ...
软件测试的原则，软件测试计划：5W1H
1.测试应该尽早介入. 2.所有的测试都应追溯到用户需求. 3.程序员应该避免检查自己的程序.除了单元测试.因为程序员对于自己的作品,思维具有局限性.无法保证测试质量.交给 ...
tomcat-9.0.20部署后输出窗口乱码解决方案
问题:启动tomcat的时候,窗口乱码,默认都是UTF-8的,但是控制台是GBK的,要保持一致可以通过控制台查看本机的编码: : 936 代表 GB2312 解决办法:打开tomcat目录下的c ...
Ubuntu网络network eth0配置 | ubuntu network configuration
本文首发于个人博客https://kezunlin.me/post/5076bc45/,欢迎阅读! ubuntu network configuration Guide network proxy S ...
kafka-manager新手安装入门指南
Kafka-manager安装教程使用环境 ubuntu18.04 Java 8 一.下载kafka 官网下载地址如下 https://www.apache.org/dyn/closer.cgi?p ...
Redis 数据结构
一.Redis简介 Redis是一款基于key-value的高性能NoSQL数据库,开源免费,遵守BSD协议.支持string(字符串) . hash(哈希) .list(列表) . set(集合) ...
Git及Github
目录 Git及Github的使用 Git的基本介绍 Git命令行操作 1.设置签名 2.创建本地库 3.仓库初始化 4.状态查看 5.添加文件 6.提交文件 7.历史记录 8.前进后退 9.删除文件 ...
和SharpDX坑爹的Variant刚正面
和SharpDX坑爹的Variant刚正面几个月前我写了和篇文章<.NET中生成动态验证码>文章,其实里面藏着一个大坑.运行里面的代码,会发现运行的gif图片并没有循环播放: 细心的网友 ...
JSONPath入门之Snack3篇
Snack3 for java 一个微型JSON框架基于jdk8,60kb.有序列化反序列化.解析和转换.支持 Json path 查询. <dependency> <groupI ...
python模块IO
Python之模块IO io概叙 io模块提供了python用于处理各种类型I/O的主要工具,主要有三种类型的I/O:文本I/O,二进制I/O和原始I/O:这些都是通用类型,各种后备存储可使用其中的每 ...

学习了JsonSchema，我自定义了一个校验代码

JsonSchema

使用fastjsonschema来校验数据

使用jsonschema来校验数据

MySchema

JSONSchema缺点

自定义JSONSchema

代码

JsonSchmea 的数据示例

使用方式

学习了JsonSchema，我自定义了一个校验代码的更多相关文章

随机推荐

热门专题