
クジラ飛行机 (著)
“生成AIの使いこなしにぐっと差がつく!
本書は、ChatGPTをはじめとする「大規模言語モデル」から、望んだ回答をうまく得るための「プロンプトエンジニアリング」を網羅的にまとめた書籍です。
大規模言語モデルの応答能力を改善・向上させるテクニックはさまざまな研究によって明かになっています。本書では、そのような改善方法について、基本的なものから複雑なものまで紹介します。
一般的な業務で大規模言語モデルを使い方にも、アプリ開発などで使いたいエンジニアの方にも役立つように、幅広い内容をカバーしています。
後半では、大規模言語モデルのAPIを利用する方法も紹介します。最後の章では高度なプロンプトエンジニアリングの手法を組み込んださまざまなプログラムの例を掲載しています。
対象となる大規模言語モデルは、人気のChatGPT(3.5/4)をはじめ、Google Gemini、Anthropic Claude、Microsoft Bingチャット、オープンソースの大規模言語モデル(Llama 2など)です。
※大規模言語モデルの回答の一部や使い方については、紙面ではなく特典Webサイトで掲載している場合があります。
本書を通して、いろいろな言語モデルで活用できる汎用的な技術を身につけましょう。
Chapter1 プロンプトエンジニアリングと大規模言語モデル
Chapter2 プロンプトエンジニアリング入門
Chapter3 大規模言語モデルの基本タスク
Chapter4 Few-shotプロンプトと性能向上のテクニック
Chapter5 テンプレートを使った10倍役立つプロンプト集
Chapter6 Web APIとオープンLLMの使い方
Chapter7 AGIを目指した高度なプロンプトエンジニアリング |
続きを読む 大規模言語モデルを使いこなすためのプロンプトエンジニアリングの教科書 →

Soledad Galli (著), 松田晃一 (翻訳)
Pythonによる機械学習モデル構築のための特徴量 抽出・作成実践レシピ
機械学習においてはモデルを作成しデータを与えて学習させますが、その前に生データをモデルが理解できるような形式に変換する「特徴量エンジニアリング」と呼ばる重要なステップがあります。
データサイエンティストはモデルの学習に使用する生データを選び特徴量に変換したり、データを組み合わせ新しい特徴量を作成します。
うまく設計された特徴量は、機械学習モデルの精度を大幅に向上させ、学習にかかる時間を短縮することができます。
本書は特徴量エンジニアリングの実践的なガイドであり、機械学習のための特徴量を作成するための効果的なテクニックとベストプラクティスを学ぶことができます。
Pythonを活用し、70以上の実践的な”レシピ”により特徴量の抽出を手軽に行います。
pandas、scikit-learnに特徴量エンジニアリングライブラリであるFeature-engine、Category Encoders、Featuretools、tsfreshを利用し、新しい特徴量を変換・作成します。
欠損データの補完、カテゴリエンコーディング、変数変換、離散化、スケーリング、外れ値の取り扱いなど表形式データに対する特徴量エンジニアリングのほぼすべてのトピックをカバー。
日付と時刻、テキスト、時系列、リレーショナルデータセットから特徴量を抽出する方法についても解説。
テキストからの特徴量の抽出の付録として日本語モデルでの実例も取り上げます。
1章 欠損値を補完する
2章 カテゴリ変数をエンコーディングする
3章 数値変数を変換する
4章 変数を離散化する
5章 外れ値を扱う
6章 日付と時刻の変数から特徴量を抽出する
7章 特徴量をスケーリングする
8章 新しい特徴量を作成する
9章 Featuretoolsを用いてリレーショナルデータから特徴量を抽出する
10章 tsfreshを使って時系列データから特徴量を作成する
11章 テキスト変数から特徴量を抽出する
付録 日本語を扱う |
続きを読む データサイエンティストのための特徴量エンジニアリング →
Adventure and Innovation! Amazing Quest!