ネクストパブリッシングで始める
オンデマンド出版

impress

書籍紹介

Python・Colab・NLP入門 PythonとGoogle Colaboratoryではじめる自然言語処理

著者:井田 昌之

Google Colaboatoryのハンズオンを通して自然言語処理を身に付けよう!

N01543

本書は自然言語処理のPythonプログラミングに必要な要点を簡潔かつわかりやすく解説しています。環境構築の手間がかからないGoogle Colaboratoryで手軽にプログラミングを試し、自然言語処理の習得へステップアップしていける入門書にふさわしい一冊です。

続きを読む

短くする

電子版 ¥1,440 小売希望価格(税別)

印刷版 ¥1,800 小売希望価格(税別)


お好きな販売サイトにてご購入いただけます

電子書籍版

  • amazon Kindleストア
  • 楽天 kobo
  • Apple Books
  • 紀伊國屋(Kinoppy)
  • Google play
  • honto電子書籍ストア
  • Reader Store
  • BookLive
  • BOOK☆WALKER

印刷書籍版

  • amazon プリント・オン・デマンド
  • 三省堂書店オンデマンド
  • hontoネットストア
  • 楽天ブックス

基本情報

発行日:2021/10/29
ページ数:148(印刷版)
ISBN:9784764960251


目次

第1章 ことはじめ
1.1 Python豆知識
1.2 Google Colaboratoryを開いてみる
1.3 インポートする:さまざまな機能はモジュールとして用意されている
1.4 ノートブックということ
1.5 インタプリタによるプログラムの実行

第2章 文法:基礎編
2.1 四則演算、変数、代入文、式、関数呼び出し、コメント
2.2 モジュール、import、モジュールにある関数の呼び出し
2.3 文字列
2.4 基本的な入出力
2.5 リストと配列、array、ndarray
2.6 条件式と判断分岐
2.7 for文による回数指定の繰り返し
2.8 while文による条件を満たす間の繰り返し
2.9 繰り返しを制御するbreak、continue、elseと多重ループ
2.10 関数を定義する
2.11 辞書型
2.12 リスト内包表記
2.13 Eval/Exec:切れ味鋭い万能関数

第3章 Google Colabに親しむ
3.1 Colabノートブックの利用
3.2 Colabでのコマンディング

第4章 モジュールに親しむ
4.1 NumPy
4.2 Pandas
4.3 グラフ表示にmatplotlibのpyplotを使う
4.4 Gensim
4.5 データセットの入手とNLTK
4.6 Scikit-learn

第5章 データファイルの読み書き
5.1 文字コードと日本語テキストデータの扱い
5.2 ファイルの読み込み
5.3 ファイルの書き込み

第6章 自然言語処理(NLP)する
6.1 NLPに便利なPythonの構文
6.2 spaCyでテキスト解析
6.3 GiNZAで、日本語テキストの形態素解析
6.4 spaCyでコサイン類似度を調べる
6.5 GiNZAで「幸福の王子」テキストの分かち書き化

第7章 WordCloudで直観を可視化
7.1 WordCloudの準備
7.2 WordCloudを実行し、画像を生成する
7.3 WordCloudに任意形を与える

第8章 トピックモデリング
8.1 LDAに取り組む
8.2 日本語テキストに対するLDAモデリング
8.3 ロイターデータセットの入門的トピックモデリング
8.4 Word2vecでトピック分析
8.5 この先の課題から


著者紹介

井田 昌之(いだ まさゆき)
青山学院大学名誉教授
工学博士

1981年、青山学院大学大学院理工学研究科経営工学専攻博士課程修了、同年同大学理工学部助手、専任講師、助教授を経て、1988年同大学付属情報科学研究センタ研究教育開発室助教授としてキャンパスネットワーク構築。1995年同大学国際政治経済学部へ移籍。97年同学部教授、2001年同大学大学院国際マネジメント研究科教授としてITおよびネットビジネス・EC基盤を担当。2010年学校法人青山学院理事・副院長、2020年3月定年退職、その後、非常勤講師としてIT、Global IT、応用AI、EC関連科目を複数大学で担当、また、教育機関でのIR指導にあたる。
この間、1988年より6年間米国ANSI X3J13正員としてCommon Lisp規格制定に従事、1993年および2002年マサチューセッツ工科大学人工知能研究所客員教授、1999年Java言語仕様レビューア、フリーソフトウェア財団副理事長などを経験。商用言語処理系開発リーダ複数経験。2005年よりIAMSCU国際教育機関連盟理事を経験。この頃より、米国IT企業交流・起業支援ならびに新事業支援経験、ベトナムでのIT設計指導・大学教育経験多数、特に、2010年よりホーチミン自然科学大学、ハノイ工科大学にて正規科目を担当。JICA短期専門家として複数国でのIT最新技術導入を指導。

主要著書
『UNIX詳説』、丸善、1984(のちにLinux詳説として改訂、2004)
『Common Lisp』、共訳、編著、共立出版、初版1985、改訂版1991
『Common Lisp オブジェクトシステム』、共著、共立出版、1989
『キャンパスネットワーキング』、分担執筆、共立出版、1990
『AI白書』、分担執筆、コンピュータエージ社、1991
『Xウィンドウとその仲間たち』、分担執筆、共立出版、1992
『Lisp原書第3版』、共訳、培風館、1992
『はやわかりJava』、共立出版、1996
『HTML詳説』、共立出版、1999
『情報の表現』、岩波講座マルチメディア情報学分担執筆、岩波書店、2000
『オープンソースがなぜビジネスになるか』、共著、毎日コミュニケーションズ、2006
『Elements of Net Business Ethics』、Cogeime(英語)、 2009