Jack's Blog

With great power, there must come great responsibility. No matter what happens, just keep moving forward!

Pandas DataFrame中对异常值的处理

一、前言相信大多数朋友们在使用Pandas读取Excel数据(如csv文件)时,表格中往往含有异常的值。这些异常值通过包括三大类: None,null,NaN。但是None和null通常可以通过“==”来判断,相对比较简单,因此本文主要介绍对NaN异常值的处理。众所周知,NaN其实指的是 Not A Number,也就是说不是一个数。 二、判断是否含有 NaN在Pandas DataFram......

爬取美团店铺数据

一、 token的解析与生成1. 概述在爬取美团店铺数据的时候,相信很多伙伴都遇到了类似这样的情况:在网页的Console能够通过XPath获取到HTML元素的值,但是在爬虫脚本中使用XPath却无法拿到,这是因为美团在获取店铺数据时加了token验证。比如,在chrome浏览器打开美团首页,右键检查,随便点击一类美食,可以看到如下图的getPoiList接口调用: 在上述图......

Windows下安装tensorflow-gpu教程

一、前言笔者这里使用的是win7系统搭建tensorflow-gpu环境,如果你使用的是win8或者win10系统,该教程依然适用,区别只是你需要下载的CUDA和cuDNN版本不同罢了。 二、Python环境安装 下载python安装包,这里笔者下载的是64位的python3.5安装包。虽然目前python3.7已经出来了,但不建议大家使用最新的版本,因为可能会出现诸多未知的问题。当然pyt......

Windows下LaTeX安装教程

一、前言LaTeX在Windows、Mac、Linux三个系统都具有发行版,而且版本也比较多,比如TeXLive、CTeX、MacTeX、MikTex等。本章中则主要介绍Windows下最常用的LaTeX安装方案,就是TeXLive + WinEdt。TeXLive 是LaTeX的运行环境,而 WinEdt 则是编写LaTeX文档的编辑器。 二、TeXLive下载1.TeXLive通过官网下......

CentOS 7 配置CDH 5.16教程

一、预先需要下载的安装包 CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel 这是Centos下的CDH软件安装包。 CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel.sha1 这里面存的是与上述CDH版本相对应的hash code。 manifest.json 以上三个包都可在该链接(https://archive.cloudera.c......
CDH