机器学习框架ML.NET学习笔记【7】人物图片颜值判断

一、概述

这次要解决的问题是输入一张照片，输出人物的颜值数据。

学习样本来源于华南理工大学发布的SCUT-FBP5500数据集，数据集包括 5500 人，每人按颜值魅力打分，分值在 1 到 5 分之间。其中包括男性、女性、中国人、外国人四个分类。

SCUT-FBP5500_full.csv文件标记了每个图片人物的颜值打分数据。（我把分值一项乘以了20，变成了满分100分，不影响计算结果）

整个程序处理流程和前一篇图片分类的基本一致，唯一的区别，分类用的是多元分类算法，这次采用的是回归算法。

二、源码

下面是全部代码：

namespace TensorFlow_ImageClassification

{    

    class Program

    {

        //Assets files download from:https://gitee.com/seabluescn/ML_Assets

        static readonly string AssetsFolder = @"D:\StepByStep\Blogs\ML_Assets";

        static readonly string TrainDataFolder = Path.Combine(AssetsFolder, "FaceValueDetection", "SCUT-FBP5500");

        static readonly string TrainTagsPath = Path.Combine(AssetsFolder, "FaceValueDetection", "SCUT-FBP5500_asia_full.csv");

        static readonly string TestDataFolder = Path.Combine(AssetsFolder, "FaceValueDetection", "testimages");

        static readonly string inceptionPb = Path.Combine(AssetsFolder, "TensorFlow", "tensorflow_inception_graph.pb");

        static readonly string imageClassifierZip = Path.Combine(Environment.CurrentDirectory, "MLModel", "imageClassifier.zip");

        //配置用常量

        private struct ImageNetSettings

        {

            public const int imageHeight = ;

            public const int imageWidth = ;

            public const float mean = ;

            public const float scale = ;

            public const bool channelsLast = true;

        }

        static void Main(string[] args)

        {

            TrainAndSaveModel();

            LoadAndPrediction();

            Console.WriteLine("Hit any key to finish the app");

            Console.ReadKey();

        }

        public static void TrainAndSaveModel()

        {

            MLContext mlContext = new MLContext(seed: );

            // STEP 1: 准备数据

            var fulldata = mlContext.Data.LoadFromTextFile<ImageNetData>(path: TrainTagsPath, separatorChar: ',', hasHeader: true);

            var trainTestData = mlContext.Data.TrainTestSplit(fulldata, testFraction: 0.2);

            var trainData = trainTestData.TrainSet;

            var testData = trainTestData.TestSet;

            // STEP 2：创建学习管道

            var pipeline = mlContext.Transforms.LoadImages(outputColumnName: "input", imageFolder: TrainDataFolder, inputColumnName: nameof(ImageNetData.ImagePath))

                .Append(mlContext.Transforms.ResizeImages(outputColumnName: "input", imageWidth: ImageNetSettings.imageWidth, imageHeight: ImageNetSettings.imageHeight, inputColumnName: "input"))

                .Append(mlContext.Transforms.ExtractPixels(outputColumnName: "input", interleavePixelColors: ImageNetSettings.channelsLast, offsetImage: ImageNetSettings.mean))

                .Append(mlContext.Model.LoadTensorFlowModel(inceptionPb).

                     ScoreTensorFlowModel(outputColumnNames: new[] { "softmax2_pre_activation" }, inputColumnNames: new[] { "input" }, addBatchDimensionInput: true))

                .Append(mlContext.Regression.Trainers.LbfgsPoissonRegression(labelColumnName: "Label", featureColumnName: "softmax2_pre_activation"));

            // STEP 3：通过训练数据调整模型

            ITransformer model = pipeline.Fit(trainData);          

            // STEP 4：评估模型

            var predictions = model.Transform(testData);

            var metrics = mlContext.Regression.Evaluate(predictions, labelColumnName: "Label", scoreColumnName: "Score");

            PrintRegressionMetrics( metrics);          

            //STEP 5：保存模型

            Console.WriteLine("====== Save model to local file =========");

            mlContext.Model.Save(model, trainData.Schema, imageClassifierZip);

        }

        static void LoadAndPrediction()

        {

            MLContext mlContext = new MLContext(seed: );

            // Load the model

            ITransformer loadedModel = mlContext.Model.Load(imageClassifierZip, out var modelInputSchema);

            // Make prediction function (input = ImageNetData, output = ImageNetPrediction)

            var predictor = mlContext.Model.CreatePredictionEngine<ImageNetData, ImageNetPrediction>(loadedModel);

            DirectoryInfo testdir = new DirectoryInfo(TestDataFolder);

            foreach (var jpgfile in testdir.GetFiles("*.jpg"))

            {

                ImageNetData image = new ImageNetData();

                image.ImagePath = jpgfile.FullName;

                var pred = predictor.Predict(image);

                Console.WriteLine($"Filename:{jpgfile.Name}:\tPredict Result:{pred.FaceValue}");

            }

        }

    }

    public class ImageNetData

    {

        [LoadColumn()]

        public string ImagePath;

        [LoadColumn()]

        public float Label;

    }

    public class ImageNetPrediction

    {

        [ColumnName("Score")]

        public float FaceValue;

    }

}

三、分析

1、数据处理通道

// STEP 2：创建学习管道

var pipeline = mlContext.Transforms.LoadImages(...)

    .Append(mlContext.Transforms.ResizeImages(...)

    .Append(mlContext.Transforms.ExtractPixels(...)

    .Append(mlContext.Model.LoadTensorFlowModel(inceptionPb)

        .ScoreTensorFlowModel(outputColumnNames: new[] { "softmax2_pre_activation" }, inputColumnNames: new[] { "input" }, addBatchDimensionInput: true))    
    .Append(mlContext.Regression.Trainers.LbfgsPoissonRegression(labelColumnName: "Label", featureColumnName: "softmax2_pre_activation"));

LoadImages、ResizeImages、ExtractPixels：上篇文章都已经介绍过了；

ScoreTensorFlowModel方法把图片像素值转换为图片特征数据，并存储在softmax2_pre_activation列，Label列保存的是颜值数据，通过回归算法形成模型，当输入新的特征数据时就可以得出对应的颜值数据。

算法采用的是：L-BFGS Poisson Regression （拟牛顿法泊松回归）

2、预测结果

在网上找了一些大头照，通过程序进行预测，右侧是预测结果：

预测结果虽然和我认为的不完全一致，但总体上可以接受，大方向没什么问题，存在偏差主要有以下几个因素：

1、学习样本的客观性存疑，其打分数据可能是分配给多人打分后汇总的，每个人标准不一致；

2、被检测图片不是很规范，如尺寸、比例、背景、使用美颜软件等；

3、颜值本身就不具备客观性，不存在标准答案，如果我说林心如比如花漂亮，大家肯定都同意，但我如果说古力娜扎比迪丽热巴漂亮，肯定有人不赞成。

四、资源获取

源码下载地址：https://github.com/seabluescn/Study_ML.NET

工程名称：TensorFlow_FaceValueDetection

资源获取：https://gitee.com/seabluescn/ML_Assets （SCUT-FBP5500）

点击查看机器学习框架ML.NET学习笔记系列文章目录

机器学习框架ML.NET学习笔记【7】人物图片颜值判断的更多相关文章

机器学习框架ML.NET学习笔记【4】多元分类之手写数字识别
一.问题与解决方案通过多元分类算法进行手写数字识别,手写数字的图片分辨率为8*8的灰度图片.已经预先进行过处理,读取了各像素点的灰度值,并进行了标记. 其中第0列是序号(不参与运算).1-64列是像 ...
机器学习框架ML.NET学习笔记【1】基本概念与系列文章目录
一.序言微软的机器学习框架于2018年5月出了0.1版本,2019年5月发布1.0版本.期间各版本之间差异(包括命名空间.方法等)还是比较大的,随着1.0版发布,应该是趋于稳定了.之前在园子里也看到 ...
机器学习框架ML.NET学习笔记【3】文本特征分析
一.要解决的问题问题:常常一些单位或组织召开会议时需要录入会议记录,我们需要通过机器学习对用户输入的文本内容进行自动评判,合格或不合格.(同样的问题还类似垃圾短信检测.工作日志质量分析等.) 处理思 ...
机器学习框架ML.NET学习笔记【2】入门之二元分类
一.准备样本接上一篇文章提到的问题:根据一个人的身高.体重来判断一个人的身材是否很好.但我手上没有样本数据,只能伪造一批数据了,伪造的数据比较标准,用来学习还是蛮合适的. 下面是我用来伪造数据的代码 ...
机器学习框架ML.NET学习笔记【5】多元分类之手写数字识别（续）
一.概述上一篇文章我们利用ML.NET的多元分类算法实现了一个手写数字识别的例子,这个例子存在一个问题,就是输入的数据是预处理过的,很不直观,这次我们要直接通过图片来进行学习和判断.思路很简单,就是 ...
机器学习框架ML.NET学习笔记【6】TensorFlow图片分类
一.概述通过之前两篇文章的学习,我们应该已经了解了多元分类的工作原理,图片的分类其流程和之前完全一致,其中最核心的问题就是特征的提取,只要完成特征提取,分类算法就很好处理了,具体流程如下: 之前介绍 ...
机器学习框架ML.NET学习笔记【8】目标检测（采用YOLO2模型）
一.概述本篇文章介绍通过YOLO模型进行目标识别的应用,原始代码来源于:https://github.com/dotnet/machinelearning-samples 实现的功能是输入一张图片, ...
机器学习框架ML.NET学习笔记【9】自动学习
一.概述本篇我们首先通过回归算法实现一个葡萄酒品质预测的程序,然后通过AutoML的方法再重新实现,通过对比两种实现方式来学习AutoML的应用. 首先数据集来自于竞赛网站kaggle.com的UC ...
ML.NET学习笔记 ---- 系列文章
机器学习框架ML.NET学习笔记[1]基本概念与系列文章目录机器学习框架ML.NET学习笔记[2]入门之二元分类机器学习框架ML.NET学习笔记[3]文本特征分析机器学习框架ML.NET学习笔记 ...

随机推荐

谈"零缺陷"
在刚参加工作初期的一次关于质量的培训中,第一次听到"零缺陷"这个词懵懵懂懂,当成一道概念题给记下.今年重读<质量免费>时对与零缺陷的部分始终心存疑虑,最近读<第一 ...
ACM学习历程——UVA11234 Expressions（栈，队列，树的遍历，后序遍历，bfs）
Description Problem E: Expressions2007/2008 ACM International Collegiate Programming Contest Unive ...
Ubuntu环境下对拍
何为对拍假设我在考场上写了一个能过样例的算法.然后它也能过大样例但是我觉得有些担心某些细节会出错,或者是它连大样例都过不了但是大样例过大无法肉眼差错,这个时候我们就需要对拍了. 所谓对拍,就是对着拍 ...
python基础知识-列表，元组，字典
列表(list) 赋值方法: l = [11,45,67,34,89,23] l = list() 列表的方法: #!/usr/bin/env python class list(object): & ...
JavaScript与DOM常见面试题
1. JavaScript 1.1.简要描述 JavaScript的数据类型? 参考答案: Java Sc ri pt 的数据类型可以分为原始类型和对象类型.原始类型包括 string. number ...
如何用python最快的获取大文件的最后几行
工作中经常会遇到处理日志文件的问题:为了得到日志的最新状态,我们需要获取日志文件的最后部分行来做判断.那么,这种情况下我们应该怎么做呢? 1)常规方法:从前往后依次读取步骤:open打开日志文件. ...
03_通过OpenHelper获取SqliteDatabase对象
MyOpenHelper openHelper = new MyOpenHelper(this); 类似于java的File file = new File();只是声明这个东西,但是文件还并没有真正 ...
【机器学习】k近邻算法（kNN）
一.写在前面本系列是对之前机器学习笔记的一个总结,这里只针对最基础的经典机器学习算法,对其本身的要点进行笔记总结,具体到算法的详细过程可以参见其他参考资料和书籍,这里顺便推荐一下Machine Le ...
20.Consent Controller Get请求逻辑实现
在这里之前讲的这一块的信息就要登场了需要通过构造函数把这几个注入进来县引入这三个命名空间把这三个注入进来,这就是显示依赖先通过returnUrl拿到这个Request request拿到后,就 ...
ACM-ICPC2018沈阳网络赛 Lattice's basics in digital electronics（模拟）
Lattice's basics in digital electronics 44.08% 1000ms 131072K LATTICE is learning Digital Electron ...

机器学习框架ML.NET学习笔记【7】人物图片颜值判断

机器学习框架ML.NET学习笔记【7】人物图片颜值判断的更多相关文章

随机推荐

热门专题