Drop Down MenusCSS Drop Down MenuPure CSS Dropdown Menu

公開日 : 2017-10-19

【Python】Google Vision APIで、スクショした表形式の画像データから文字を抽出してみたよん

このエントリーをはてなブックマークに追加

目的とやりたいこと


PDFとかならいいんですけど、画像データのテーブルを手動で写すのは尋常もなく面倒くさいのでなんとかできないかと考えていました。ほら、例えば雑誌でしか手に入らないテーブルって、切り抜きを手動でエクセルにまとめるぐらいしか方法がないじゃないですか。


だから最終的には、スクショした画像がそのままCSVになるってのがいいんですけど、それがどうやったらできそうかなぁと考えたときに


・画像ファイルから文字を抽出してくれるようなアルゴリズムを書く
・抽出した文字をCSV形式に変換して、保存できるアルゴリズムを書く


という流れが必要だと考えたわけです。そこで、画像ファイルを文字に抽出してくれるのでいい方法がないかなと考えたときに、機械学習で精度を極限まで高めたGoogleのVision APIなんてよさそうだ!と思い、試してみました。ちなみに画像から文字を検知するのはTEXT DETECTIONというらしいです。


今回やりたいこととしては、Pythonを利用して、Google Vision APIで、スクショしたテーブルイメージのテキストを取得するところまでです。校舎の抽出した文字をCSV形式に変換して、保存できるアルゴリズムは今回のスコープ対象外とします。今回はできなかったけど、Python コーディングでCSVにいい感じに変換ってところまでをやりたいです。


Google Vision APIを取得と、実装



とりあえず、下記サイトで、APIの登録方法に従い、無料体験プランに登録してください。そして下記サイトのコードを参考にコードをコピペしました

凄すぎ!Google Cloud Vision APIをつかって簡単高精度にOCR

今回は、Google Cloud Vision APIのOCRを試してみたら精度が良すぎてビビったので、やり方と結果を紹介してみます。 上のリンクにアクセスし、 プロジェクトを作成した上で、


しかし上記サイトのコードがPython2に対応だったので、Python3の場合は以下のページを参考に、適当に修正してください。下記のソースコードを利用して、いい感じにコピペしてください。

[Google Cloud Vision] python 3.5 でリクエストした時のエラー対処 (is not JSON serializable)

以前こちら↓の記事でGoogle Cloud Visionの記事を紹介したのですが、掲載したコードはpython2.7での挙動を確認したものでした。 今回ちょっとした用でpython3.5で動かしてみたところエラーがでて動かなくなってい



実行結果


今回は、こういう短い数字の画像をスクショしてみたところ、いい感じにデータをJSON形式で取得できました。




$ python OCRProject.py
begin request
end request
{
  "responses": [
    {
      "textAnnotations": [
        {
          "locale": "en",
          "description": "o 1 4 6 7 9\n",
          "boundingPoly": {
            "vertices": [
              {
                "x": 12,
                "y": 2
              },
              {
                "x": 160,
                "y": 2
              },
              {
                "x": 160,
                "y": 34
              },
              {
                "x": 12,
                "y": 34
              }
            ]
          }
        },
        {
          "description": "o",
          "boundingPoly": {
            "vertices": [
              {
                "x": 12,
                "y": 2
              },
              {
                "x": 21,
                "y": 2
              },
              {
                "x": 21,
                "y": 34
              },
              {
                "x": 12,
                "y": 34
              }
            ]
          }
        },
        {
          "description": "1",
          "boundingPoly": {
            "vertices": [
              {
                "x": 34,
                "y": 2
              },
              {
                "x": 43,
                "y": 2
              },
              {
                "x": 43,
                "y": 34
              },
              {
                "x": 34,
                "y": 34
              }
            ]
          }
        },

以下、取得したJSONデータの公式リファレンスです。

Text detection samples | Google Cloud Vision API Documentation | Google Cloud Platform

For your convenience, the Cloud Vision API can perform Text detection directly on an image file located in Google Cloud Storage or on the Web without the need to send the contents of the image file in the body of your request.


し、しかし・・・・文字の座標とかいらねんだよ!!
ほしいのはJSONのresponses > textAnnotations > descriptionsの文字列データのみをなんじゃ!さて、困ったものだ!そこで、PythonでDictionary型に変換して、必要なとこだけ取得できるのがよさそうだなぁと考えました。


ということで、


・JSON形式のAPIレスポンスを、Python用に処理しやすいようDictionary型に変換
・Dictionary型から、responses > textAnnotations > descriptionsの文字列データをプリントする


ってことを、適当にググって修正したコードがこちらです。(べたうちビンビン丸)
(image.jpgは、下記の画像です。pythonファイルが存在する同一階層上に存在する適当なファイルでございます。)

http://tmaita77.blogspot.jp/2017/10/blog-post_9.html


#!/usr/bin/python
#coding:utf-8
import base64
import json
from requests import Request, Session
from bs4 import BeautifulSoup

path = "image.JPG"

def recognize_captcha(str_image_path):
        bin_captcha = open(str_image_path, 'rb').read()

        #str_encode_file = base64.b64encode(bin_captcha)
        str_encode_file = base64.b64encode(bin_captcha).decode("utf-8")
       

        str_url = "https://vision.googleapis.com/v1/images:annotate?key="

        str_api_key = "ここにAPI KEYをいれてね!"

        str_headers = {'Content-Type': 'application/json'}

        str_json_data = {
            'requests': [
                {
                    'image': {
                        'content': str_encode_file
                    },
                    'features': [
                        {
                            'type': "TEXT_DETECTION",
                            'maxResults': 10
                        }
                    ]
                }
            ]
        }
       
        print("begin request")
        obj_session = Session()
        obj_request = Request("POST",
                              str_url + str_api_key,
                              data=json.dumps(str_json_data),
                              headers=str_headers
                              )
        obj_prepped = obj_session.prepare_request(obj_request)
        obj_response = obj_session.send(obj_prepped,
                                        verify=True,
                                        timeout=60
                                        )
        print("end request")

        if obj_response.status_code == 200:
            #print (obj_response.text)
            with open('data.json', 'w') as outfile:
                json.dump(obj_response.text, outfile)
            return obj_response.text
        else:
            return "error"

if __name__ == '__main__':
    data = json.loads(recognize_captcha(path))
    data = data["responses"]
    print(data)
    for i in data:
        print(i["fullTextAnnotation"]["text"])


ちょこっと頭を使ったところに関しては、ここの下り。


data = json.loads(recognize_captcha(path))
    data = data["responses"]
    print(data)
    for i in data:
        print(i["fullTextAnnotation"]["text"])


json形式をdictionary形式に変換してdateにぶち込みます。そんで、なんか外側に余計なかっこが存在するので、for分で取っ払います。あとは、先ほどのresponses > fullTextAnnotation>textにアクセスできるように実装しましたんご


で、出力結果がこちら

$python OCRproject.py
>
首都圏の公務員就職率の上位20位
設置




















大学·学部名
日本文化大学·法学部
創価大学·看護学部
東京大学法学部
千葉大学法経学部
千葉大学·園芸学部
首都大学東京·都市環境学部
北里大学·獣医学部生物環境科学科
千葉科学大学危機管理学部
慶應義塾大学·理工学部
お茶の水女子大学·生活科学部
千葉大学·文学部
埼玉大学·工学部
中央大学·法学部
埼玉大学·経済学部(昼間)
日本社会事業大学·社会福祉学部
お茶の水女子大学文教育学部
国際武道大学·体育学部
東京大学·教養学部
東京大学·農学部(獣医学課程以外)
専修大学·法学部(一部)
母数
229
75
294
352
110
95
82
210
573
98
172
160
1188
297
193
170
460
129
74
697
48.9
41.3
31.0
28.1
26.4
26.3
25.6
23.8
23.6
23.5
23.3
22.5
21.5
20.9
19.7
18.2
18.0
17.8
17.6
17.5



いいねぇ、画像にテキストが埋め込まれているわけじゃないのに、きれいに出ました!
文字の出力の精度高すぎ!!さっすが独裁グローバル企業!

課題


出たは出たんだけど、たぶんOCRは縦に列を見て、今度は横の列を見てって処理を行っているみたいなので、へんなふうに改行されてしまいます。これだとちょっとなぁ、確かにいちいちマニュアルでデータを入力する作業コピーしなくても済むけど、エクセルでコピペして列ずらすとかの作業は必要になってしまうなぁと思いました。


解決された領域はこんな感じです。

・データを手動で入力 →〇
・ファイルの整理 → △
・CSV出力 → ×


今度は、この取得したデータをもとに、いい感じにデータを整理して、CSVファイルに落とし込む方法を模索してみたいと思います。おそらくやり方は二つあって、


・Google Vision APIで行で処理してくれる方法を探す
・全要素数と列数から、一列あたりの要素数を特定し、その値をどんどん列に追加していく


前者は、ここの要素に座標が付随されているので、同一列のものをグルーピングしていく方法が考えられます。


後者は、全要素数を3でわって、その列の最後の数まで列に値を追加、次にその次の列に値を追加、というのをfor文回してあげればできるんじゃないかなぁと考えていますが、それだと引数に列数を指定したり、ユーザビリティが落ちそうですね。


とりあえず、いろいろ考えてみます。うんこ!

スポンサーリンク

公開日 : 2017-10-14

ヨッピーの「明日クビになっても大丈夫」って本が死ぬほど面白かったのでまとめてみた

このエントリーをはてなブックマークに追加


こんにちは、DAIです。最近は2chのひろゆき氏や、哲学者の中島義道氏、Webライターのヨッピー氏など、ちょっと社会的に不適合そうだけど、めっちゃくちゃ面白い人の書籍を読み漁っています笑



今回は、Webライターのヨッピーさんが9月12日に出版した本をネットで見つけ、「あ!市長とシムシティやってたおっさんだ!面白そうw」と思い、この書籍をKindleでポチりました。タイトルは「明日クビになっても大丈夫!」という、相変わらずふざけたタイトルですが、面白そうなので買ってしまいました笑



明日クビになっても大丈夫!
ヨッピー
幻冬舎 (2017-09-21)
売り上げランキング: 933

普段ヨッピーさんが書いている記事は死ぬほど面白いです。例えば、

>市長って本当にシムシティが上手いの? 千葉市長とガチンコ勝負してみた
とか、
> エロいとはげるって本当?実際に調査してみた

とか。今回書いていることは結構まじめなことが多くて、普通にビジネス書としてもかなり面白かったので、特に面白かったところをまとめてみます。ちなみに広告とか、ライターの人とか、フリーランスやりたい人にはぜひおすすめの書籍です!


目次


・生産する趣味と消費する趣味の違い
・大事なのは世の中にアウトプットし続けること
・情報は発信する場所に集まる
・会社を辞めてもいい三つの条件  
・儲かりそうな椅子の探し方:プラスワン戦略の勧め
・広さ×深さ×距離感の法則


>スポンサーリンク



スポンサーリンク

大学の統計学が難しすぎてついていけない人でもわかる、統計学のおすすめ書籍8選

このエントリーをはてなブックマークに追加

安心して!大学の統計学は基本わかりにくいから笑



こんにちは、大学センター数学1Aが49点だったDAIです。そうです、ど文系です。


きっとこの記事読んでいる人は、大学で学ぶ統計学に、何らかの苦手意識があると思うんですね。


安心してください。僕もそうでした。ど文系の私も、大学で初めて統計学の講義に出たときに、思いました。「ちょ、大学の統計学の授業って、どんだけわかりにくいんだ!www」「大学の統計学の授業ってどんだけつまらないんだwwwww」と。


で、この直感は当たってました。というのもですね、大学の統計学の授業って、高校レベルの数学ちゃんとマスターしてますぞい!って人を対象にしているので、ど文系でいきなり「おい!なんとかついて来いよ!お前らわかってる体でやるからなwwwがはは!じゃあこのシグマは・・・・」みたいな教授に教えられても、「先生、そのたらこ唇みたいな記号なんですか?」みたいな話になるわけで、そりゃわかるはずないんですよw 難しすぎますから。


で、数学って基本的に基礎的なことわかってないと先に進めないので、完全に統計学が難しいと思い込んでしまい、統計アレルギーの大学生が続出してしまうんだと思います。


それと、大学の統計学って、理論を学ぶものばっかで、データ分析して何か新しいインサイトを発見するってことほとんどしないんですよね。ってことで、難しいし意味わからないし、何の意味も感じられないしwww糞教科じゃねえかこれ!ってなるわけです。


大学の統計学が難しすぎるなら、まずは超簡単な書籍から始めようじゃないか!



なので、僕がおすすめするのは、極限まで簡単な統計の基礎から学んでいき、そこから少しずつレベルを上げた参考書を選んでいくという方法です。どんなに数学音痴な僕でも統計学の基礎ならなんとかなりました。統計学初心者だとまずどこから始めるべきかわからないと思うので、超絶簡単なのから紹介していきます。


あと、統計学で理論ばかりやってると、「え、こんなのやってても意味なくね?え?母集団?標本?ごちゃごちゃうるせえぞ」みたいな気持ちになるので、超絶実践的にデータいじる系の書籍をご用意しました。ということで、Lets Introduce


①マンガでわかる統計学


マンガでわかる統計学
マンガでわかる統計学
posted with amazlet at 17.10.13
高橋 信 トレンドプロ
オーム社
売り上げランキング: 7,034


はい、マンガでわかる統計学でございます。いきなり萌え絵の書籍を紹介してきて、「なんだこいつキモオタか」と思ったあなた、安心してください。そう思っていた時代、僕もありました。この統計学の本、もう少し表紙がしっかりしていたらもっと早く手に取って楽に統計学を学べたのになぁと今でも後悔しております笑


これ、たぶん統計学初心者で、今まさにつまづいているのであればすぐ買ったほうがいいです。あ、シグマってそういう意味なんだ!え、相関係数ってそんな簡単な話なの?あ~検定って超簡単じゃんw」ってなりました。たぶん中学三年生でも、読めばわかるレベルなので、まずはだまされたと思って買ってみるのがいいと思います。(ちなみにAmazonが一番安かったです)

本書は統計の基礎から独立性の検定まで、マンガで理解!
統計の基礎である平均、分散、標準偏差や正規分布、検定などを押さえたうえで、アンケート分析に必要な手法の独立性の検定ができることを目標としている。
統計の基礎を、学びたい方に最適の一冊。


マンガでわかる統計学
マンガでわかる統計学
posted with amazlet at 17.10.13
高橋 信 トレンドプロ
オーム社
売り上げランキング: 7,034



教科書だけでは足りない大学入試攻略確率分布と統計的な推測―少ない勉強量で高得点がねらえる分野を攻略 (河合塾シリーズ)





そして、これが実践演習用のテキスト。上のマンガでわかる統計学で理解した知識を、実際に手を動かしながら解いてみてください。え?萌え絵と高校数学の教科書すすめてくんなって?そうですよね、僕もそう思ってました。一時期萌え絵と参考書片手に大学図書館にこもっていたので、へんな仮面浪人のオタクだと思われていたと思います。


でもね、違うんですよ。大学教授って教えることが仕事ではないので、簡単なことをすごく難しく伝えるんです。むしろ難しいことをすごく簡単に伝えるのが予備校の教師陣なんですよ。だから、普通に基礎科目なら彼らが書いている高校数学の参考書使ったほうが100倍いいこと結構あります。これはマンガでわかる統計学とセットで買ったほうがいいですね!


内容としては、さきほど学習した偏差の話や、推測統計(母集団・標本)も扱います。これも解説がめちゃんこわかりやすいので、おすすめですね。ちなみにこれ一冊やったら、「なんだ大学の統計学ちょろいじゃんw」って思いました。




1億人のための統計解析 エクセルを最強の武器にする



1億人のための統計解析 エクセルを最強の武器にする
西内 啓
日経BP社
売り上げランキング: 165,300


これは、別にやらなくても、テストの点数はとれると思います。が!しかし、この本を使って実際に統計学がどんな感じで使えるのか、試してほしいです。これで僕は統計学に目覚めました。実際の顧客データから、統計分析して、「このお客さんはこの商品を買う傾向があるけど、この年齢層のお客さんはあまりないなぁ」みたいなことをエクセルを使いながら学ぶという本になっています。今まで扱ってなかった、回帰分析や重回帰分析を、理論より先に実際のデータに触れて楽しめるので、おすすめですね。(ちなみにいきなり回帰分析に入ると、最小二乗法やら偏微分やらわけわかんない糞数学用語がばんばんでてきて、つまんねとなります)



1億人のための統計解析 エクセルを最強の武器にする
西内 啓
日経BP社
売り上げランキング: 165,300



ちなみに、ここまでで、基礎的な統計学(大学1-2年生時)に出てくる内容は網羅されます。ここから先は、「実際に卒論で統計学使うつもりだぜ~」みたいな人とか、「もっと分析してみたい!なんか出せよゴラァ」みたいな人だけ見てください!


>スポンサーリンク


教育・心理系研究のためのデータ分析入門 第2版



教育・心理系研究のためのデータ分析入門 第2版
平井明代
東京図書
売り上げランキング: 133,000


教育・心理系研究のためのデータ分析入門です。お値段は少々高め。3000円です。「まじで大学教授金稼いでるんだから安くしろよな!」と思うところですが、ぐっと我慢。


さて、今まで我流の統計分析を学んできたわけですが、実際に論文を書くとなると、卒論の指導教官に「え、君、そのデータどこから持ってきたの?え?食堂?サンプル偏りすぎじゃない?ぶち殺すよ!」と脅されることも多々あります。つまり、データをどうとるかとか、そのデータを図る指標ってしっかりしてるの?みたいな話になってくるわけです。


ということで、この本で学べるのは、ちゃんとした研究計画をもとに、ちゃんとしたデータを集めて、ちゃんとした分析をする!ってことです。このへんの内容になると、分散分析など、実験系で使う統計手法が出てきたりします。が、このへんのことが理解できれば、卒論は心配ないんじゃないですかね。


(ちなみに各いう私は、卒論のアンケート調査の際、友達が少なすぎてサンプルが集まらず、就職が決まっていたのに留年しかけるというエピソードを持っているので、まずは友達を作るかイケメンに生まれなおすことから始めたほうがいいと思います。)



教育・心理系研究のためのデータ分析入門 第2版
平井明代
東京図書
売り上げランキング: 133,000



Rによるやさしい統計学



Rによるやさしい統計学
Rによるやさしい統計学
posted with amazlet at 17.10.13
山田 剛史 杉澤 武俊 村井 潤一郎
オーム社
売り上げランキング: 5,031


さて、ここまで勉強してくると、「おっしゃぁ!大量のデータ分析するぞい!まずはデータを紙に書いて・・・・・って、データ多すぎワロタw」とか「え、データの処理面倒くさwww」とか、「え!エクセルって二項ロジスティック回帰分析できないの?くそじゃんw」みたいな悩みが少しずつ出てきます。


まあそれでもだいたいの学生が、4万円ぐらいするIBM制のSPSSという、4年間で一度使う核兵器みたいな破壊力を持つ統計ソフトウェアを使って卒論のデータを分析するのがあるあるなんですが、ほとんど何も考えなくてもデータ分析できちゃうぜっていう代物なんですね。


で、今回紹介するのは、そんな核兵器を使わず、かつ自分の力で統計分析してみたいよ!って人、また「いろいろ理論は学んできたけど、まだ実際大数の法則のシミュレーションとかしたことないから、どんな感じで収束するのかわかんねw」みたいな人におすすめです。実際にプログラミングコード(Rという簡単な言語)を利用して統計学を分析するので、かなり理論が実践に近づくと思います。



Rによるやさしい統計学
Rによるやさしい統計学
posted with amazlet at 17.10.13
山田 剛史 杉澤 武俊 村井 潤一郎
オーム社
売り上げランキング: 5,031


さて、ここから先はさらにその上に行く、統計学ちゃんと学びたい派のために書きますので、もう疲れた人は鼻ほじっていてください。


統計学入門



統計学入門 (基礎統計学Ⅰ)

東京大学出版会
売り上げランキング: 1,847

かなり有名な書籍ですが、統計学入門という書籍。こちらは「入門」と書いていますが、数学をやってきた人にとっては入門だといわれています。僕ら大学統計学の底辺からしたら、「統計学・ラスボス」とか「統計学・甲骨文字解読」ぐらいのレベル間なので、最初に間違えて手を出して統計の世界から去っていった人を多く見てきました。


が、今までの書籍をちゃんと理解できていれば、いままで勉強してきたことを大学教授が一般化して難しく話しているだけに聞こえるので、こちらは読み物として読んでおくのがおすすめです。


統計学入門 (基礎統計学Ⅰ)

東京大学出版会
売り上げランキング: 1,847

統計検定3級


統計検定級3級の問題集ですね。なにに使うかよくわかりませんが、

本書は統計検定3級(高校卒業レベル)、4級(中学卒業レベル)の過去問と解説を収録しています。掲載しているのは、2014年から2016年の6回の試験で実際に出題されたすべての問題です。日本統計学会認定、唯一の問題集です。

らしいです。僕の英検5級という、穴を拭く紙にすらならない検定よりは、ましだと思います。統計が本当に好きになってしまった人、どうせ統計やるなら検定まで受けようwみたいな人がいたらぜひ読んでみてください笑




ちなみにこちらが統計検定2級。

●統計検定2級
試験内容は「統計学基礎(大学基礎科目)」。大学基礎課程(1・2年次学部共通)で習得すべきことについて検定を行います。

日本統計学会公式認定 統計検定 2級 公式問題集[2014〜2016年]

実務教育出版
売り上げランキング: 1,626



>スポンサーリンク


大学の統計学は難しくない。簡単なレベルからやればできる


いかがだったであろうか。大学の統計学って、実はそんな難しくないです。本質的には、難しいことからいきなりやろうとしてるから難しくかんじるだけだと思います。3歳の自転車乗れない子供に、がけから補助輪なしで自転車で吹っ飛ばしているようなものですから笑


ということで、気になった書籍があったら読んでみてください~アマゾンが一番安かったですよ。


マンガでわかる統計学
マンガでわかる統計学
posted with amazlet at 17.10.13
高橋 信 トレンドプロ
オーム社
売り上げランキング: 7,034









1億人のための統計解析 エクセルを最強の武器にする
西内 啓
日経BP社
売り上げランキング: 165,300





教育・心理系研究のためのデータ分析入門 第2版
平井明代
東京図書
売り上げランキング: 133,000



Rによるやさしい統計学
Rによるやさしい統計学
posted with amazlet at 17.10.13
山田 剛史 杉澤 武俊 村井 潤一郎
オーム社
売り上げランキング: 5,031


統計学入門 (基礎統計学Ⅰ)
統計学入門 (基礎統計学Ⅰ)
posted with amazlet at 17.10.13

東京大学出版会
売り上げランキング: 1,847



日本統計学会公式認定 統計検定 2級 公式問題集[2014〜2016年]

実務教育出版
売り上げランキング: 1,626


>スポンサーリンク







スポンサーリンク

公開日 : 2017-10-12

【News Picks集客】いつ記事を投稿したらより読んでもらえるのか計測してみた

このエントリーをはてなブックマークに追加
News Picksで自分が選んだ記事を投稿することができます。「この記事について多くの人の意見を聞いてみたい!」という方も多いのではないでしょうか。


そこで、今回はNews Picksにいつ投稿したら、その記事がより読んでもらえるのか検証してみました



スポンサーリンク

公開日 : 2017-10-10

教育が好きな人におすすめの本16選!教育 × 心理学・社会学・経済学・テクノロジー・思想系

このエントリーをはてなブックマークに追加

教育に興味がある人におすすめの書籍を紹介するよ!


こにゃにゃちは、Daiです。私実は大の教育オタクでして、大学生の時は塾講師やったり、教育ITベンチャーで働いたり、放課後支援ボランティア、卒論は教育社会学やってたりと、本当に教育しかやってこなかったんですよね。まあそうなりゃ教育系の本を100冊以上読んできた訳です。


で、今回は特に面白かった教育関係のおすすめな本を紹介してみます。一応読者の想定は教育学関係のことに興味ある大学生や社会人向けですね!


目次


  • 教育 X 社会学・経済学
    • 1. 教室内(スクール)カースト (光文社新書) 【Kindle版あり】
    • 2. 保育園義務教育化 【Kindle版あり】
    • 3. 学力と階層 【Kindle版あり】
    • 4. データで読む 教育の論点
    • 5. 教育の社会学 新版- 〈常識〉の問い方,見直し方 (有斐閣アルマ)
    • 6. 「学力」の経済学 【Kindle版あり】
    • 7. 幼児教育の経済学 【Kindle版あり】
  • 教育 X 心理学
    • 8. やり抜く力 GRIT(グリット)――人生のあらゆる成功を決める「究極の能力」を身につける 【Kindle版あり】
    • 9. モチベーション3.0 【Kindle版あり】
    • 10. やさしい教育心理学 第4版 (有斐閣アルマ)
  • 教育 X テクノロジー
    • 11. 世界はひとつの教室 「学び×テクノロジー」が起こすイノベーション 【Kindle版あり】
    • 12. 予備校なんてぶっ潰そうぜ 【Kindle版あり】
    • 13. 教育×破壊的イノベーション~教育現場を抜本的に変革する
  • 教育 X 思想
    • 14. 学校と社会 (岩波文庫)
    • 15. グーグル、ディズニーよりも働きたい「教室」
    • 16. 下流志向
  • 個人的におすすめな教育書籍トップ3


スポンサーリンク

大学生におすすめ!一人で引きこもってできるお金がかからない趣味5選

このエントリーをはてなブックマークに追加


大学生になると、相当フリーな時間ができて、暇になりなりますよね。僕は大学1年生の夏休み、あまりにも暇すぎて一人でドラクエをやっていたら夏休みが終わっていました。「もったいねぇな時間」と思いながら、趣味を見つけられなくて困った記憶があります。


大学生活の4年間で一人でできる最高に楽しい趣味を見つけてしまい、完全に引きこもり型になった私ですが、僕が心からおすすめできるお金のかからない趣味を5つ紹介したいと思います。



スポンサーリンク

公開日 : 2017-10-09

Googleの検索結果が上位になると、クリック率が何パーセント上がるのか調べてみた

このエントリーをはてなブックマークに追加
題名の通り。SEO対策では、検索ボリュームの大きいページのページ順位を上げて、クリック率(CTR)を上げていく。今回気になったのは、「ページ順位が1あがると、クリック率がいくつ上がるか」という疑問だ。






そこで、今回は僕が運営するReview of My Lifeというブログの検索データを、Google Consoleから取得し、ページ連載順位から、CTRを予測する統計分析してみた。


データセットは、僕の過去の1カ月分の検索履歴データだ。そして、その中で以下の処理を行った。

  • 月間の検索数が100未満のものを削除
  • ページランクが10位以上のものは削除

もととなるデータセットは、469個のデータが存在したが、上記2通りの処理を行い、49個のデータになってしまったが、今回はこのデータで分析してみる。



スポンサーリンク

【Python】Pandasチュートリアル - CSVの読み書き:データの表示・追加・編集・削除を行う -

このエントリーをはてなブックマークに追加
PythonのPandasを利用して、CSVの読み込みや、データの追加・削除・編集などを行い、CSVの書き込みまでできる方法を解説します。また、特に頻出のメソッドと、そのメソッドの説明についてもやっていきたいと思います。


目次



  • Pandasが扱うオブジェクトとは? Dataframe型とSeries型の違い
  • データフレームを作成する
  • データシリーズを作成する
  • データフレームにデータシリーズを代入する
  • CSVデータを読み込む
  • データを眺める
  • 条件が合致するデータを取得データを消去する
  • 列を並び替える
  • データをコピーする(バックアップ用)
  • 特定の行の値を含む行を検索する
  • 特定の列の順番をつける
  • データのクリーニング





スポンサーリンク

Amazonプライムも、Kindle Unlimitedも、無料で1カ月体験できるらしい!

このエントリーをはてなブックマークに追加

Amazon Prime Readingとは何ぞや?



Amazonがつい最近、電子書籍読み放題サービス「Prime Reading」をリリースしました。

アマゾンジャパン(Amazon.co.jp)は10月5日、「Amazonプライム」会員が利用できる電子書籍の読み放題サービス「Prime Reading」を開始した。追加料金なしでマンガ、小説、ビジネス書、雑誌などが閲覧可能になる。

Amazon、電子書籍読み放題「Prime Reading」開始 (ITmedia ビジネスオンライン)

アマゾンジャパンが、「Amazonプライム」会員向けの電子書籍読み放題サービス「Prime Reading」を開始した。


あれ?Amazonって以前にKindle Unlimitedという同様の電子書籍読み放題サービスもやってたよね?」と思いまして、そうするとPrime Readingとはなんぞや?という話になります。そこで今回は、Prime ReadingとKindle Unlimitedの違いについて解説し、どちらのサービスがよいのかを見ていきたいと思います。



スポンサーリンク

Read more↓

書評














教育











キャリア

プログラミング・ライフハック

About me


・ 最近The Academic Timesというアカデミック専用メディアを立ち上げました。