PHP-过滤器-连接数据库-解析XML

PHP 过滤器

what?

PHP 过滤器用于验证和过滤来自非安全来源的数据，比如用户的输入。

验证和过滤用户输入或自定义数据是任何 Web 应用程序的重要组成部分。

设计 PHP 的过滤器扩展的目的是使数据过滤更轻松快捷。

why?

几乎所有 web 应用程序都依赖外部的输入。这些数据通常来自用户或其他应用程序（比如 web 服务）。通过使用过滤器，您能够确保应有程序获得正确的输入类型。

您应该始终对外部数据进行过滤！

输入过滤是最重要的应用程序安全课题之一。

什么是外部数据？

来自表单的输入数据
Cookies
服务器变量
数据库查询结果

函数和过滤器

如需过滤变量，请使用下面的过滤器函数之一：

filter_var() - 通过一个指定的过滤器来过滤单一的变量
filter_var_array() - 通过相同的或不同的过滤器来过滤多个变量
filter_input - 获取一个输入变量，并对它进行过滤
filter_input_array - 获取多个输入变量，并通过相同的或不同的过滤器对它们进行过滤

在下面的例子中，我们用 filter_var() 函数验证了一个整数：

<?php

$int = 123;

if(!filter_var($int, FILTER_VALIDATE_INT))

 {

 echo("Integer is not valid");

 }

else

 {

 echo("Integer is valid");

 }

?>

上面的代码使用了 "FILTER_VALIDATE_INT" 过滤器来过滤变量。由于这个整数是合法的，因此代码的输出是："Integer is valid"。

假如我们尝试使用一个非整数的变量，则输出是："Integer is not valid"。

Validating 和 Sanitizing

有两种过滤器：

Validating 过滤器：

用于验证用户输入
严格的格式规则（比如 URL 或 E-Mail 验证）
如果成功则返回预期的类型，如果失败则返回 FALSE

Sanitizing 过滤器：

用于允许或禁止字符串中指定的字符
无数据格式规则
始终返回字符串

选项和标志

选项和标志用于向指定的过滤器添加额外的过滤选项。

不同的过滤器有不同的选项和标志。

在下面的例子中，我们用 filter_var() 和 "min_range" 以及 "max_range" 选项验证了一个整数：

<?php

$var=300;

$int_options = array(

"options"=>array

 (

 "min_range"=>0,

 "max_range"=>256

 )

);

if(!filter_var($var, FILTER_VALIDATE_INT, $int_options))

 {

 echo("Integer is not valid");

 }

else

 {

 echo("Integer is valid");

 }

?>

就像上面的代码一样，选项必须放入一个名为 "options" 的相关数组中。如果使用标志，则不需在数组内。

由于整数是 "300"，它不在指定的范围内，以上代码的输出将是 "Integer is not valid"。

验证输入

让我们试着验证来自表单的输入。

我们需要作的第一件事情是确认是否存在我们正在查找的输入数据。

然后我们用 filter_input() 函数过滤输入的数据。

在下面的例子中，输入变量 "email" 被传到 PHP 页面：

<?php

if(!filter_has_var(INPUT_GET, "email"))

 {

 echo("Input type does not exist");

 }

else

 {

 if (!filter_input(INPUT_GET, "email", FILTER_VALIDATE_EMAIL))

  {

  echo "E-Mail is not valid";

  }

 else

  {

  echo "E-Mail is valid";

  }

 }

?>

例子解释：

上面的例子有一个通过 "GET" 方法传送的输入变量 (email)：

检测是否存在 "GET" 类型的 "email" 输入变量
如果存在输入变量，检测它是否是有效的邮件地址

净化输入

让我们试着清理一下从表单传来的 URL。

首先，我们要确认是否存在我们正在查找的输入数据。

然后，我们用 filter_input() 函数来净化输入数据。

在下面的例子中，输入变量 "url" 被传到 PHP 页面：

<?php

if(!filter_has_var(INPUT_POST, "url"))

 {

 echo("Input type does not exist");

 }

else

 {

 $url = filter_input(INPUT_POST, "url", FILTER_SANITIZE_URL);

 }

?>

例子解释：

上面的例子有一个通过 "POST" 方法传送的输入变量 (url)：

检测是否存在 "POST" 类型的 "url" 输入变量
如果存在此输入变量，对其进行净化（删除非法字符），并将其存储在 $url 变量中

假如输入变量类似这样："http://www.W3非o法ol.com.c字符n/"，则净化后的 $url 变量应该是这样的：

http://www.W3School.com.cn/

过滤多个输入

表单通常由多个输入字段组成。为了避免对 filter_var 或 filter_input 重复调用，我们可以使用 filter_var_array 或 the filter_input_array 函数。

在本例中，我们使用 filter_input_array() 函数来过滤三个 GET 变量。接收到的 GET 变量是一个名字、一个年龄以及一个邮件地址：

<?php

$filters = array

 (

 "name" => array

  (

  "filter"=>FILTER_SANITIZE_STRING

  ),

 "age" => array

  (

  "filter"=>FILTER_VALIDATE_INT,

  "options"=>array

   (

   "min_range"=>1,

   "max_range"=>120

   )

  ),

 "email"=> FILTER_VALIDATE_EMAIL,

 );

$result = filter_input_array(INPUT_GET, $filters);

if (!$result["age"])

 {

 echo("Age must be a number between 1 and 120.<br />");

 }

elseif(!$result["email"])

 {

 echo("E-Mail is not valid.<br />");

 }

else

 {

 echo("User input is valid");

 }

?>

例子解释：

上面的例子有三个通过 "GET" 方法传送的输入变量 (name, age and email)

设置一个数组，其中包含了输入变量的名称，以及用于指定的输入变量的过滤器
调用 filter_input_array 函数，参数包括 GET 输入变量及刚才设置的数组
检测 $result 变量中的 "age" 和 "email" 变量是否有非法的输入。（如果存在非法输入，）

filter_input_array() 函数的第二个参数可以是数组或单一过滤器的 ID。

如果该参数是单一过滤器的 ID，那么这个指定的过滤器会过滤输入数组中所有的值。

如果该参数是一个数组，那么此数组必须遵循下面的规则：

必须是一个关联数组，其中包含的输入变量是数组的键（比如 "age" 输入变量）
此数组的值必须是过滤器的 ID ，或者是规定了过滤器、标志以及选项的数组

使用 Filter Callback

通过使用 FILTER_CALLBACK 过滤器，可以调用自定义的函数，把它作为一个过滤器来使用。这样，我们就拥有了数据过滤的完全控制权。

您可以创建自己的自定义函数，也可以使用已有的 PHP 函数。

规定您准备用到过滤器函数的方法，与规定选项的方法相同。

在下面的例子中，我们使用了一个自定义的函数把所有 "_" 转换为空格：

<?php

function convertSpace($string)

{

return str_replace("_", " ", $string);

}

$string = "Peter_is_a_great_guy!";

echo filter_var($string, FILTER_CALLBACK, array("options"=>"convertSpace"));

?>

以上代码的结果是这样的：

Peter is a great guy!

例子解释：

上面的例子把所有 "_" 转换成空格：

创建一个把 "_" 替换为空格的函数
调用 filter_var() 函数，它的参数是 FILTER_CALLBACK 过滤器以及包含我们的函数的数组

连接mysql数据库

1、连接

<?php

$mysqli = mysqli_connect("localhost", "root", "123123");

if ($mysqli) {

    echo 'mysql connect success!<br>';

}

else{

    echo "mysql connect failed!<br>";

//    echo mysqli_error($mysqli);

}

?>

2、关闭

<?php

if (mysqli_close($mysqli)) {

    echo '<br>mysql connection close!';

}

?>

3、选择数据库

<?php

mysqli_select_db("test", $mysqli);

?>

4、执行sql(insert into)

<?php

$sql = "CREATE TABLE Persons

(

personID int NOT NULL AUTO_INCREMENT,

PRIMARY KEY(personID),

FirstName varchar(15),

LastName varchar(15),

Age int

)";

mysqli_query($sql,$mysqli);

mysqli_query("INSERT INTO Persons (FirstName, LastName, Age)

VALUES ('Peter', 'Griffin', '35')");

?>

5、执行SQL（select）

<?php

mysqli_select_db("my_db", $con);

$result = mysqli_query("SELECT * FROM Persons");

while($row = mysqli_fetch_array($result))

  {

  echo $row['FirstName'] . " " . $row['LastName'];

  echo "<br />";

  }

?>

解析XML

如需读取和更新 - 创建创建并处理 - 一个 XML 文档，您需要 XML 解析器。

有两种基本的 XML 解析器类型：

基于树的解析器：这种解析器把 XML 文档转换为树型结构。它分析整篇文档，并提供了 API 来访问树种的元素，例如文档对象模型 (DOM)。
基于事件的解析器：将 XML 文档视为一系列的事件。当某个具体的事件发生时，解析器会调用函数来处理。

expat XML

Expat 解析器是基于事件的解析器。

基于事件的解析器集中在 XML 文档的内容，而不是它们的结果。正因如此，基于事件的解析器能够比基于树的解析器更快地访问数据。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

<?php

/**

 * Created by IntelliJ IDEA.

 * User: zzd

 * Date: 2018/3/4

 * Time: 10:32

 * expat是基于事件的xml解析器，利于读取数据

 */

//Initialize the XML parser

//通过 xml_parser_create() 函数初始化 XML 解析器

$parser=xml_parser_create();

//创建配合不同事件处理程序的的函数

//Function to use at the start of an element

function start($parser,$element_name,$element_attrs)

{

    switch($element_name)

    {

        case "NOTE":

            echo "-- Note --<br />";

            break;

        case "TO":

            echo "To: ";

            break;

        case "FROM":

            echo "From: ";

            break;

        case "HEADING":

            echo "Heading: ";

            break;

        case "BODY":

            echo "Message: ";

    }

}

//Function to use at the end of an element

function stop($parser,$element_name)

{

    echo "<br />";

}

//Function to use when finding character data

function char($parser,$data)

{

    echo $data;

}

//Specify element handler

//添加 xml_set_element_handler() 函数来定义，当解析器遇到开始和结束标签时执行哪个函数

xml_set_element_handler($parser,"start","stop");

//Specify data handler

//添加 xml_set_character_data_handler() 函数来定义，当解析器遇到字符数据时执行哪个函数

xml_set_character_data_handler($parser,"char");

//Open XML file

$fp=fopen("test.xml","r");

//Read data

while ($data=fread($fp,4096))

{

    //通过 xml_parse() 函数来解析文件 "test.xml"

    xml_parse($parser,$data,feof($fp)) or

    //万一有错误的话，添加 xml_error_string() 函数把 XML 错误转换为文本说明

    die (sprintf("XML Error: %s at line %d",

        xml_error_string(xml_get_error_code($parser)),

        xml_get_current_line_number($parser)));

}

//调用 xml_parser_free() 函数来释放分配给 xml_parser_create() 函数的内存

//Free the XML parser

xml_parser_free($parser);

?>

DOM XML

DOM 解析器是基于树的解析器。

W3C DOM 提供了针对 HTML 和 XML 文档的标准对象集，以及用于访问和操作这些文档的标准接口。

W3C DOM 被分为不同的部分 (Core, XML 和 HTML) 和不同的级别 (DOM Level 1/2/3)：

Core DOM - 为任何结构化文档定义标准的对象集
XML DOM - 为 XML 文档定义标准的对象集
HTML DOM - 为 HTML 文档定义标准的对象集

1

2

3

4

5

6

7

8

9

<?php

$xmlDoc = new DOMDocument();

$xmlDoc->load("note.xml");

print $xmlDoc->saveXML();

?>

/**

George John Reminder Don't forget the meeting!

*/

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

<?php

$xmlDoc = new DOMDocument();

$xmlDoc->load("note.xml");

$x = $xmlDoc->documentElement;

foreach ($x->childNodes AS $item)

  {

  print $item->nodeName . " = " . $item->nodeValue . "<br />";

  }

?>

/**

#text = 

to = George

#text = 

from = John

#text = 

heading = Reminder

#text = 

body = Don't forget the meeting!

#text = 

*/

/**

在上面的例子中，您看到了每个元素之间存在空的文本节点。

当 XML 生成时，它通常会在节点之间包含空白。XML DOM 解析器把它们当作普通的元素，如果您不注意它们，有时会产生问题。

*/

simple XML

SimpleXML 是 PHP 5 中的新特性。在了解 XML 文档 layout 的情况下，它是一种取得元素属性和文本的便利途径。

与 DOM 或 Expat 解析器相比，SimpleXML 仅仅用几行代码就可以从元素中读取文本数据。

SimpleXML 可把 XML 文档转换为对象，比如：

元素 - 被转换为 SimpleXMLElement 对象的单一属性。当同一级别上存在多个元素时，它们会被置于数组中。
属性 - 通过使用关联数组进行访问，其中的下标对应属性名称。
元素数据 - 来自元素的文本数据被转换为字符串。如果一个元素拥有多个文本节点，则按照它们被找到的顺序进行排列。

当执行类似下列的基础任务时，SimpleXML 使用起来非常快捷：

读取 XML 文件
从 XML 字符串中提取数据
编辑文本节点或属性

不过，在处理高级 XML 时，比如命名空间，最好使用 Expat 解析器或 XML DOM。

加载 XML 文件
取得第一个元素的名称
使用 children() 函数创建在每个子节点上触发的循环
输出每个子节点的元素名称和数据

1

2

3

4

5

6

7

8

9

10

<?php

$xml = simplexml_load_file("test.xml");

echo $xml->getName() . "<br />";

foreach($xml->children() as $child)

  {

  echo $child->getName() . ": " . $child . "<br />";

  }

?>