並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 44件

新着順 人気順

scikit-learnの検索結果1 - 40 件 / 44件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

scikit-learnに関するエントリは44件あります。 機械学習Pythonpython などが関連タグです。 人気エントリには 『QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "鉄板のPython教材といえば東大が無料公開している「Pythonプログラミング入門」 ・Google Colabなので環境構築でハマる心配がない ・基本文法, Numpy, pandas, scikit-learnまで平易に学… https://t.co/bGyo4HKFZF"』などがあります。
  • QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "鉄板のPython教材といえば東大が無料公開している「Pythonプログラミング入門」 ・Google Colabなので環境構築でハマる心配がない ・基本文法, Numpy, pandas, scikit-learnまで平易に学… https://t.co/bGyo4HKFZF"

    鉄板のPython教材といえば東大が無料公開している「Pythonプログラミング入門」 ・Google Colabなので環境構築でハマる心配がない ・基本文法, Numpy, pandas, scikit-learnまで平易に学… https://t.co/bGyo4HKFZF

      QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "鉄板のPython教材といえば東大が無料公開している「Pythonプログラミング入門」 ・Google Colabなので環境構築でハマる心配がない ・基本文法, Numpy, pandas, scikit-learnまで平易に学… https://t.co/bGyo4HKFZF"
    • KNNアルゴリズム(K-近傍法)をscikit-learnを使わず5行で実装する。(Python)|es

      機械学習のライブラリは抽象化されていますが、どのように動いているいるのか、アルゴリズムは絶対理解しておいた方がいいいです。逆に機械学習を学ぶということは、アルゴリズムの理解が大部分を占めます。 k-近傍法(k-nearest neighbor algorithm)は、分類や回帰のためのシンプルな機械学習アルゴリズムです。 k-近傍法は、新しいデータが与えられたときに、そのデータが近いとされる、学習用のデータセット中の個々のサンプルとの距離を計算します。その後、これらのサンプルからk個の最も近いサンプル(k-nearest neighbors)を選択します。これらk個のサンプルから、新しいサンプルが最も多く分類されるクラスを予測します。 例えば、新しいサンプルが緑の点としてプロットされているとします。k=3の場合、この新しいサンプルに最も近い2つのサンプル(緑の点)を選択します。この3つのサ

        KNNアルゴリズム(K-近傍法)をscikit-learnを使わず5行で実装する。(Python)|es
      • scikit-learn入門&使い方 ― 機械学習の流れを学ぼう

        ここを更新しました(公開日:2024年4月11日、更新日:2024年12月2日) 2024年12月2日最新のColab環境で、記事内の全てのコードが正常に動作することを検証しました。 前回は、機械学習の基礎と、主要なPythonライブラリの概要を説明しました。 今回は、Pythonを使った機械学習プログラミングの基本的な流れを、実際にコードを書きながら体験的に学んでいきましょう。具体的には、データの読み込みと加工から、グラフによる可視化、統計的な数値計算、そして簡単な機械学習モデルの構築まで、基本的な一連の流れを体験できます(図1)。

          scikit-learn入門&使い方 ― 機械学習の流れを学ぼう
        • ロジスティック回帰をscikit-learnを使わずゼロから実装する(Python)|es

          機械学習を理解するにはアルゴリズムをから実装するのが一番です。そして問いデータを使って遊んでみましょう。 ロジスティック回帰とは、二項分類(2値分類)を行うための方法です。二項分類とは、ある物体がAかBのどちらかに分類することを指します。例えば、試験の点数が60点以上かどうかで分類することができます。 ロジスティック回帰では、試験の点数だけでなく、その他の情報も考慮に入れることができます。例えば、試験の点数だけでなく、勉強時間や家庭環境なども考慮に入れることができます。これらの情報を使って、試験の点数が60点以上かどうかを推定することができます。 import numpy as np class LogisticRegression: def __init__(self): self.w = None self.b = None def fit(self, X, y, learning_r

            ロジスティック回帰をscikit-learnを使わずゼロから実装する(Python)|es
          • K-Meansクラスタリング scikit-learnを使わずゼロから実装する(Python)||es

            K-Meansは個人的にも好きなアルゴリズムで、教師あり学習を必要とせず、混沌とした中からパターンを見つけ出してくれる可能性があります。 実際、実践で使うとそのような都合の良いデータはほとんどなく、むしろ 仮説を否定する場合に使う方が現実的かもしれません。 自分の場合、顧客のセグメント分けに使うことが多いです。 ステップ 1. ランダムに k 個のデータポイントを初期のセントロイドとして選ぶ。 ステップ 2. トレーニングセット内のデータポイントと k 個のセントロイドの距離(ユークリッド距離)を求める。 ステップ 3. 求めた距離に基づいて、データポイントを一番近いセントロイドに割り当てる。 ステップ 4. 各クラスタグループ内のポイントの平均を取ることでセントロイドの位置を更新する。 ステップ 5. ステップ 2 から 4 をセントロイドが変化しなくなるまで繰り返します。 以下、シンプ

              K-Meansクラスタリング scikit-learnを使わずゼロから実装する(Python)||es
            • scikit-learnとtidymodelsの比較

              こんにちは,shun(@datasciencemore)です!! 今回は,scikit-learnとtidymodelsの比較をしていきたいと思います. 機械学習をするための有名なパッケージとして,Pythonはscikit-learn,Rはtidymodelsが挙げられます. これらは何が違うのでしょうか? それを確認するために以下の4つの観点でscikit-learnとtidymodelsを比較してみましょう. 連携性収納性統一性一貫性 結論からいうとtidymodelsの圧勝です!! scikit-learnとtidymodelsの比較結果を表にまとめるとこのようになります. 以下,これらの4つの観点について詳細に見ていきましょう! 1.連携性 まずは1つ目,連携性についてです. データサイエンスプロジェクトは主にこんな感じの業務フローなのでした. 図を見ていただくとお分かりになると

              • 実際にscikit-learnで出力されるPrecisionやRecallを事例に、適合率と再現率の意味を説明しようと思う - Qiita

                分類モデルの評価指標として、適合率や再現率などがあります。Web上で多くの解説記事がありますが、scikit-learnのclassification_reportに表示される各指標を読み解くためには、プラスアルファの理解が必要です。この記事では、実際にscikit-learnで出力される内容を例にして、適合率と再現率の意味を解説します。 Webとかでよくある説明 機械学習で分類モデルを評価するとき、正解率(Accuracy)、適合率(Precision)、再現率(Recall)、F1-scoreなどの評価指標をよく利用します。これらの解説として、以下のような2値分類の説明が多くあります。 正解率(Accuracy) 正解率(Accuracy) は、全体の中で正解した割合 正解率 = (20 + 1) ÷ (20 + 2 + 3 + 1) ≒ 0.81 適合率(Precision) 適合率

                  実際にscikit-learnで出力されるPrecisionやRecallを事例に、適合率と再現率の意味を説明しようと思う - Qiita
                • scikit-learn の機械学習パイプライン

                  はじめに 機械学習で予測モデルを作るときは データの分割 データの前処理 予測モデルの学習 クロスバリデーションによるハイパーパラメータチューニング といった手順を踏む必要がある。慣れるまではこれらの手順に対応する scikit-learn のクラスをひとつひとつ呼び出して自分で一連の処理をやってみるのが勉強になるが、慣れてしまうと似たような手続きを毎回書くのは非常に面倒くさい。 scikit-learn には、この一連の処理を簡潔に記述するためのパイプラインの仕組みがあるので、その使用方法について説明する。 一連のコードは Google Colab 上にアップロードしてある。 データの分割 これは人間が管理すべき問題なので、自動化もやろうと思えばできるだろうが、人間がいちいちやったほうがよい。機械学習をやるとき、データは基本的に 訓練データ 教師データともいう。予測モデルを学習させるため

                    scikit-learn の機械学習パイプライン
                  • 【機械学習初心者向け】scikit-learn「アルゴリズム・チートシート」の全手法を実装・解説してみた - Qiita

                    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? scikit-learnのアルゴリズム・チートシートで紹介されている手法を全て実装し、解説してみました。 注釈 本記事シリーズの内容は、さらに丁寧に記載を加え、書籍「AIエンジニアを目指す人のための機械学習入門 実装しながらアルゴリズムの流れを学ぶ」 として、出版いたしました。 概要 scikit-learn アルゴリズム・チートシート 【対象者】機械学習を使用したい方、初心者向けの機械学習本を読んで少し実装してみた方 scikit-learnの説明は英語で分かりにくいし、実装例もシンプルでなくて、よく分からんという方 【得られるもの】

                      【機械学習初心者向け】scikit-learn「アルゴリズム・チートシート」の全手法を実装・解説してみた - Qiita
                    • 【入門者向け】特徴量選択の基本まとめ(scikit-learnときどきmlxtend) - Qiita

                      Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

                        【入門者向け】特徴量選択の基本まとめ(scikit-learnときどきmlxtend) - Qiita
                      • NumPy / Pandas / Matplotlib / scikit-learn などの理解度確認ができる「Python 3 エンジニア認定データ分析試験」に合格した - kakakakakku blog

                        先週末に「Python 3 エンジニア認定データ分析試験」を受験して合格した🎉とても良い試験で,特に試験勉強をする過程で知識の幅が広がった.試験の認知度向上のためにも紹介したいと思う.当然ながら試験問題に関しては何も書かず,基本的に公開情報をベースにまとめていく! www.pythonic-exam.com 試験概要 : Python 3 エンジニア認定データ分析試験 📊 試験名にもある通り「Python 3 エンジニア認定データ分析試験」は Python を使った「データ分析」に関する理解を問う試験で「数学」や「Python ライブラリ」に関する出題が多くある.詳しくは以下に出題範囲を載せる. セクション 出題数 出題率 データエンジニアの役割 2 5.0% Python と環境 : 実行環境構築 1 2.5% Python と環境 : Python の基礎 3 7.5% Pytho

                          NumPy / Pandas / Matplotlib / scikit-learn などの理解度確認ができる「Python 3 エンジニア認定データ分析試験」に合格した - kakakakakku blog
                        • scikit-learnの学習結果をpickleしない - Qiita

                          機械学習を簡単に行うための有用なライブラリの一つはscikit-learnである。 この文書では、scikit-learnの学習結果をpickleしないで済ます方法について述べる。 scikit-learnの特徴 各種識別器の学習・予測・評価方法のためのインターフェースがそろえてある設計。 各種アルゴリズムを試して、比較しやすい。 ドキュメントが充実している。 前提 python scikit-learn pickle scikit-learn に欠けているもの scikit-learnで学習した結果を保持するための枠組みが不足している。 そのため、sckit-learnで作った学習済みの識別器をpickleして、それをpickl.loads(pickle済みのファイル)して使ってしまうということをしてしまいやすい。 問題点 scikit-learn のサイトでも、pickleしたものを使

                            scikit-learnの学習結果をpickleしない - Qiita
                          • scikit-learn 入門:6つの機能と分類・回帰の実装方法を徹底解説!

                            皆さんは、scikit-learn(よみ:サイキット・ラーン)をご存知でしょうか。Pythonを使っている方、機械学習を学ばれている方なら一度は耳にしたことがあることでしょう。しかし、scikit-learnを知っている方の中でも、scikit-learnでいったい何ができるのか、その全貌を知っている方はそれほど多くはないのではないでしょうか。 そこで本稿では、scikit-learnの4つの特徴と、6つの主な機能について詳しく解説した上で、実際に回帰と分類の実装を行います。機械学習をこれから学ぼうとされている方はもちろん、scikit-learnを使っている皆さんも改めて、本稿でscikit-learnの良さを学びましょう。 scikit-learnとは まずは、scikit-learnとはいったいどのようなライブラリで、どのような特徴があるのかを解説していきます。 scikit-lea

                              scikit-learn 入門:6つの機能と分類・回帰の実装方法を徹底解説!
                            • scikit-learnのLatent Dirichlet Allocation (LDA) のcoherenceを求める - Qiita

                              はじめに ちゃお…† まいおり…† LDA (Latent Dirichlet Allocation)、わたしの好きなモデルです。 しかし、現時点のscikit-learn (1.2.2) にはLDAモデルのcoherence (コヒーレンス) を求める関数はありません。 そこで強引に?LDAモデルのcoherenceを求める方法を記します。 コヒーレンスとは 記述や事実の集合は、それらが互いに支持し合っている場合、首尾一貫している (coherent) と言われます。したがって、首尾一貫した事実の集合は、事実のすべてまたは大部分をカバーする文脈で解釈することができます。 トピックのコヒーレンスを測るとは、トピック内の高得点単語間の意味的類似性の程度を測定することで、単一のトピックをスコアリングすることです。これらの測定は、意味的に解釈可能なトピックと、統計的推論の成果物であるトピックを区

                                scikit-learnのLatent Dirichlet Allocation (LDA) のcoherenceを求める - Qiita
                              • ブラウザサイドでNumPyもscikit-learnもできるPython環境「Pyodide」がすごい

                                Pyodideとは WASM上にビルドされたPython+NumPyなどのデータ分析ライブラリの実行環境です。 これまでにwebでPythonを使うとしたら、サーバサイドで使うか、BrythonのようなものでJavaScriptにトランスパイルするしかありませんでした。Brythonもajaxができたり結構な数の標準モジュールがサポートされていたりとすごいんですが、仕組み上NumPyのようなCによる低レイヤー拡張を含む外部ライブラリは使えません。 そこに出てきたのがPyodideです。これはWASMで全部まるっとコンパイルしているので、NumPyもscikit-learnも使えます。get startedしたらあまりの簡単さとポテンシャルにひっくり返ったので書いておきます。 github: https://github.com/pyodide/pyodide ドキュメント: https:/

                                  ブラウザサイドでNumPyもscikit-learnもできるPython環境「Pyodide」がすごい
                                • GitHub - BeastByteAI/scikit-llm: Seamlessly integrate LLMs into scikit-learn.

                                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                    GitHub - BeastByteAI/scikit-llm: Seamlessly integrate LLMs into scikit-learn.
                                  • ScikitAllStars: 主要なscikit-learnの教師あり機械学習法を全部Optunaでチューニングしてスタッキングまでやっちゃうツール - Qiita

                                    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

                                      ScikitAllStars: 主要なscikit-learnの教師あり機械学習法を全部Optunaでチューニングしてスタッキングまでやっちゃうツール - Qiita
                                    • 【Python 入門】scikit-learn(sklearn)とは?初学者向けにわかりやすく解説!

                                      scikit-learn とは? scikit-learn は、Python で利用できるデータ分析や機械学習のためのライブラリの一つです。scikit-learn は、データの前処理や、機械学習のアルゴリズムを使った学習・予測、そしてモデルの評価など、データ分析や機械学習に必要な機能をひとまとめにしたパッケージです。 scikit-learn はとても使いやすく、多機能で人気のライブラリです。使い始めるのも手間がかからず、データの前処理から機械学習、評価までの一連の流れをスムーズに行うことができます。 scikit-learn の特徴 幅広いアルゴリズムのサポート 分類、回帰、クラスタリング、次元削減など、多岐にわたるタスクのためのアルゴリズムが提供されています。初学者から上級者まで、多様なニーズに応えることができます。 高い互換性 scikit-learn は、Python のデータ処

                                        【Python 入門】scikit-learn(sklearn)とは?初学者向けにわかりやすく解説!
                                      • Scikit-learn DevSprint Japan 2021 Spring : 富士通

                                        富士通研究所は、AI分野における世界最大のOSSであるScikit-learnをサポートするため、2019年からScikit-learnコンソーシアムに加入し、OSSコミュニティの持続的発展に寄与しています。 今回、Scikit-learn のDevSprint JapanをScikit-learnコンソーシアムと共同で5月26日(水)- 5月28日(金)の日程で開催することになりましたので、参加者を募集します。 またDevSprint Japanに合わせて、Scikit-learnやトポロジカルデータ解析技術の機械学習応用(富士通研究所で開発しているTopological Data Analysis Time Series Shaper: TDA-TSS含む)に関するチュートリアルも開催します。 Scikit-learn DevSprint Japanについて・日程: 2021年5月26

                                          Scikit-learn DevSprint Japan 2021 Spring : 富士通
                                        • scikit-learnで単変量特徴量選択をやってみた - Qiita

                                          # 単変量特徴量選択(univariate feature selection)のラッパークラスを作成 class UnivariateFeatureSelection: def __init__(self, n_features, problem_type, scoring): if problem_type == 'classification': valid_scoring = { 'f_classif': f_classif, 'chi2': chi2, 'mutual_info_classif': mutual_info_classif } else: valid_scoring = { 'f_regression': f_regression, 'mutual_info_regression': mutual_info_regression } # 手法が対応していない場合の例

                                            scikit-learnで単変量特徴量選択をやってみた - Qiita
                                          • Scikit-learnが実験的にGPU対応していたので調査してみた! - Qiita

                                            はじめに みずほリサーチ&テクノロジーズ株式会社の@fujineです。 いきなりですがAIエンジニアの皆さん、scikit-learnが実験的にGPUに対応していたこと、ご存知でしょうか? scikit-learnは機械学習分野における古参パッケージの1つです。多様な機能を提供する一方、FAQにて「GPUに対応する予定はない(キリッ)」と公式宣言しており、scikit-learnが好きな自分としては「勿体無いなぁ」と常々感じていました。 そんな中、何気なくRelease Highlights for 1.2を読んでいたら以下文面を発見!しかも約半年前の2022年12月にリリースされてる… Experimental Array API support in LinearDiscriminantAnalysis Experimental support for the Array API sp

                                              Scikit-learnが実験的にGPU対応していたので調査してみた! - Qiita
                                            • ところてん on X: "情報IIの教科書、普通にscikit-learnで機械学習してるし、クラスタリングしてるし、SQLite3でRDBMSしているし、やばいんですよ https://t.co/XsDutAhLC8"

                                              • scikit-learn 1.0 リリース!更新内容を一部紹介します。 | フューチャー技術ブログ

                                                こんにちは、TIG所属の玉木です。この記事はPython連載の7本目の記事になります。 2021年9月24日にscikit-learn 1.0がリリースされました。私が大学院生のころ、scikit-learnのサンプルを動かすところから機械学習を勉強したので、ついに1.0かとなんだか感慨深い気持ちがあります(この記事で紹介しているPython 機械学習プログラミングです)。本記事ではリリースから少し時間が経ってしまいましたが、リリースハイライト、チェンジログから、個人的に気になった以下の4つの内容を紹介しようと思います。 キーワード引数の強制 pandasのデータフレームからの特徴量名のサポート 新しいplot用のクラス追加 StratifiedGroupKFoldの追加 1. キーワード引数の強制scikit-learnの機械学習のモデルのクラス、メソッドは、多くの入力パラメータを持ちま

                                                  scikit-learn 1.0 リリース!更新内容を一部紹介します。 | フューチャー技術ブログ
                                                • Scikit-learnを用いた階層的クラスタリング (Hierarchical clustering)の解説 – S-Analysis

                                                  目次1. 階層的クラスタリングの概要 __1.1階層的クラスタリング (hierarchical clustering)とは __1.2所と短所 __1.3 凝集クラスタリングの作成手順 __1.4 sklearn のAgglomerativeClustering __1.5 距離メトリック (Affinity) __1.6 距離の計算(linkage) 2. 実験・コード __2.1 環境の準備 __2.2 データロード __2.3 Euclidean距離のモデル学習・可視化 __2.4 Manhattan距離のモデル学習・可視化 __2.5 Cosine距離のモデル学習・可視化 1.1 階層的クラスタリング (hierarchical clustering)とは階層的クラスタリングとは、個体からクラスターへ階層構造で分類する分析方法の一つです。樹形図(デンドログラム)ができます。デンド

                                                  • scikit-learnで求めたLassoの解パスとCVの結果を可視化する | DevelopersIO

                                                    データアナリティクス事業本部の鈴木です。 Lassoは、例えばscikit-learnを使うと簡単にクロスバリデーション(以降CV)で正則化パラメータとそのときの回帰係数を推定できます。一方で、単にCVで最適なモデルを求めるだけではなく、解パス図を描いて回帰係数の変化を詳しくみたり、CVで求めた値を使ってより簡単なモデルを選択したりしたいと思ったので、scikit-learnの関数を使って試してみました。 Lassoとは Lassoは線形回帰モデルの回帰係数の推定法の一つで、係数の推定時にいくつかの係数を0にすることで変数選択を行える手法です。 以下のように回帰係数のL1ノルムを正則化項として誤差二乗和に付けた関数を、回帰係数について最小化することで回帰係数を推定します。 ただし、L1ノルムは以下です。 例えば2変数の場合、以下の斜線部に誤差二乗和部分(第1項目)の解βLSが入る場合にその

                                                      scikit-learnで求めたLassoの解パスとCVの結果を可視化する | DevelopersIO
                                                    • 【Python】scikit-learnで単・重回帰分析 - Qiita

                                                      # sklearn.linear_model.LinearRegression クラスを読み込み from sklearn import linear_model import pandas as pd import numpy as npy import matplotlib.pyplot as plt import numpy as np import requests import io clf = linear_model.LinearRegression() url = 'http://pythondatascience.plavox.info/wp-content/uploads/2016/07/winequality-red.csv' res = requests.get(url) df = pd.read_csv(io.BytesIO(res.content), sep="

                                                        【Python】scikit-learnで単・重回帰分析 - Qiita
                                                      • 【scikit-learn】Random forest回帰、デフォルトだとrandom forestじゃないよって話 - Qiita

                                                        はじめに 初めまして、いわです。 今回は、scikit-learnのRandom forest regressorをデフォルトのパラメータで使用するとRandom forestとしては機能していないという話をします。 Random forestとは? Random forestは決定木ベースのアルゴリズムである、くらいの理解はある前提で話を進めます。 まず、random forestの定義について説明します。 以下のqiita記事とRandom forestの論文を参考にしました。 定義 学習データから重複を許してランダムに複数組のサンプル集合を抽出(Bootstrap Aggregating: バギング) 各ノードを分割するために特徴量をランダムに選択する(ここ重要)と、Adaboostと比較して良好な結果が得られる ジニ係数を計算し、決定木を作成 予測時は各決定木の結果でアンサンブルに

                                                          【scikit-learn】Random forest回帰、デフォルトだとrandom forestじゃないよって話 - Qiita
                                                        • Machine Learning with PyTorch and Scikit-Learn

                                                          Machine Learning with PyTorch and Scikit-Learn has been a long time in the making, and I am excited to finally get to talk about the release of my new book. Initially, this project started as the 4th edition of Python Machine Learning. However, we made so many changes to the book that we thought it deserved a new title to reflect that. So, what’s new, you may wonder? In this post, I am excited to

                                                          • Python: scikit-learn の LabelEncoder を説明変数の変換に使うのは誤り - CUBE SUGAR CONTAINER

                                                            scikit-learn の LabelEncoder を説明変数の変換に使っている例はたくさん見つかる。 しかし、実は本来 LabelEncoder は目的変数の変換に使うことが想定されていることは、あまり知られていない。 これは公式のドキュメントで確認できる。 scikit-learn.org 上記から一部を引用する。 This transformer should be used to encode target values, i.e. y, and not the input X. このように、入力として想定されているのが本来は目的変数であることが読み取れる。 ようするに Iris データセットでいう setosa とか versicolor を 0 とか 1 に変換するのが本来の目的ということ。 メソッドの引数名を見ても X ではなく y になっている。 なので Pipelin

                                                              Python: scikit-learn の LabelEncoder を説明変数の変換に使うのは誤り - CUBE SUGAR CONTAINER
                                                            • scikit-learnのk-meansでirisデータをクラスタリングしてみよう!【サンプルコード有り】 | 自動化ラボっ!

                                                              はじめに Pythonの機械学習モジュールであるscikit-learnは数多くの機械学習アルゴリズムをカンタンに使うことができることがわかりました。これまでは本ブログで紹介したのはいわゆる「教師あり学習」の問題が多かったのですが、今回は「教師なし」のアルゴリズムであるクラスタリングを行うこととしましょう。 ちなみに、教師あり、なしとはよく言いますが概要を述べると、教師あり学習は 教師あり学習(きょうしありがくしゅう, 英: Supervised learning)とは、機械学習の手法の一つである。事前に与えられたデータをいわば「例題(=先生からの助言)」とみなして、それをガイドに学習(=データへの何らかのフィッティング)を行うところからこの名がある。 出典: フリー百科事典『ウィキペディア(Wikipedia)』 これに対して、教師なし学習は 教師なし学習(きょうしなしがくしゅう, 英:

                                                                scikit-learnのk-meansでirisデータをクラスタリングしてみよう!【サンプルコード有り】 | 自動化ラボっ!
                                                              • Release Highlights for scikit-learn 1.0

                                                                Release Highlights for scikit-learn 1.0# We are very pleased to announce the release of scikit-learn 1.0! The library has been stable for quite some time, releasing version 1.0 is recognizing that and signalling it to our users. This release does not include any breaking changes apart from the usual two-release deprecation cycle. For the future, we do our best to keep this pattern. This release in

                                                                • Pythonで様々な機械学習手法が使える「scikit-learn」、分類処理を体験しよう

                                                                  機械学習とは、大量のデータから成る既知の情報(説明変数)から、全体の傾向などを導き出し、未知の結果(目的変数)を予測(推論)する手法のことです。ディープラーニングに代表される現在のAIの仕組みは、機械学習がベースになっています。 機械学習の超定番と言えるライブラリが、「scikit-learn」です。インストールコマンドは以下です。

                                                                    Pythonで様々な機械学習手法が使える「scikit-learn」、分類処理を体験しよう
                                                                  • Scikit-Learnが遅いので、C++製の超高速機械学習ライブラリを作った話 - Qiita

                                                                    import time import numpy as np from sklearn.metrics import accuracy_score from sklearn.model_selection import train_test_split import warnings warnings.simplefilter("ignore") from veloxml.tree import RandomForestClassification # from sklearn.ensemble import RandomForestClassifier fit_time_list = [] pred_time_list = [] for i in range(100): # ランダムシード rng = np.random.default_rng() # データ数と特徴量数 num_sam

                                                                      Scikit-Learnが遅いので、C++製の超高速機械学習ライブラリを作った話 - Qiita
                                                                    • scikit-learn の fit() / transform() / fit_transform() - Qiita

                                                                      scikit-learn の変換系クラス(StandardScaler、Normalizer、Binarizer、OneHotEncoder、PolynomialFeatures、Imputer など) には、fit()、transform()、fit_transform()という関数がありますが、何を使ったらどうなるかわかりづらいので、まとめてみました。 関数でやること fit() 渡されたデータの最大値、最小値、平均、標準偏差、傾き...などの統計を取得して、内部メモリに保存する。 transform() fit()で取得した統計情報を使って、渡されたデータを実際に書き換える。 fit_transform() fit()を実施した後に、同じデータに対してtransform()を実施する。 使い分け トレーニングデータの場合は、それ自体の統計を基に正規化や欠損値処理を行っても問題ないので

                                                                        scikit-learn の fit() / transform() / fit_transform() - Qiita
                                                                      • scikit-learn and Hugging Face join forces

                                                                        Hugging Face is happy to announce that we’re partnering with scikit-learn to further our support of the machine learning tools and ecosystem. At Hugging Face, we’ve been putting a lot of effort into supporting deep learning, but we believe that machine learning as a whole can benefit from the tools we release. With statistical machine learning being essential in this field and scikit-learn dominat

                                                                        • 【簡易版:Androidのブラウザで実現するpython環境】機械学習(pytorch, scikit-learn)や実用的なプログラミング(jupyterlab, pandas, matplotlib, strearmlit)の環境構築について

                                                                          【経緯】簡易版:Androidのブラウザで実現するpython環境の紹介について 以前に紹介しておりましたTermuxをベースとしたjupyterlab環境について、Termuxをupgradeすると、pythonのバージョンまで上がってしまい、元のpython環境を再現できなくなってしまったようです。。 参考リンク:Termux Wiki Python – Termux Wiki 【一部内容を転載します】 Warning: upgrading major/minor version of Python package, for example from Python 3.8 to 3.9, will make all your currently installed modules unusable. You will need to reinstall them. However up

                                                                            【簡易版:Androidのブラウザで実現するpython環境】機械学習(pytorch, scikit-learn)や実用的なプログラミング(jupyterlab, pandas, matplotlib, strearmlit)の環境構築について
                                                                          • scikit-learn数値系特徴量の前処理まとめ(Feature Scaling) - Qiita

                                                                            KaggleのTitanicチャレンジで前処理をスムーズにできないかを調べていたら、知らないことも多く勉強となりました。もともと、標準化と正規化という単語すら毎回思い出している程度の理解度だったのでいい機会となりました。標準化と正規化程度しか知らなかったですが、意外と処理方法が多く異常値への考慮で多くの知見を得ることができました。 scikit-learnの数値系特徴量に対する前処理(preprocessing)モジュールを整理しています。基本的にscikit-learn ユーザガイド 6.3. Preprocessing data中心です。本当はカテゴリ型変数もやろうと思ったのですが、数値系だけで書くこと多すぎたので他記事に書くと思います。 scikit-learnのユーザガイドは素晴らしいのだけど、一方で単語で理解に時間がかかることも多いですね(私の英語力や数理的能力不足)。 カテゴリ

                                                                              scikit-learn数値系特徴量の前処理まとめ(Feature Scaling) - Qiita
                                                                            • scikit-learnとFlaskによる機械学習モデルのサービング - Qiita

                                                                              著者: 伊藤 雅博, 株式会社日立製作所 はじめに データサイエンティストが作成した機械学習モデルを本番環境へ導入するためには、機械学習モデルを用いた予測機能を提供(サービング)するシステムの開発が必要となります。本投稿では、実際にscikit-learn pipelinesとFlaskを使用して機械学習モデルをサービングする例を紹介します。 投稿一覧: MLOpsの概要と機械学習モデルのサービングシステム scikit-learnとFlaskによる機械学習モデルのサービング ...本投稿 構築するリアルタイム推論システムの全体像 Web APIを用いたリアルタイム推論システムの構築手順を紹介します。前回の投稿で紹介したようなサービングFWを活用する方法もありますが、今回は個別のOSSを組み合わせてシンプルな推論システムを構築してみます。 この推論システムでは、Python製の機械学習フレ

                                                                                scikit-learnとFlaskによる機械学習モデルのサービング - Qiita
                                                                              • 【scikit-learn基礎】実際に線形回帰モデルを構築する - Qiita

                                                                                はじめに 機械学習初心者がscikit-learnの学習をアウトプットするために実際のデータを使って予測モデルを構築します。 今回は一番シンプルな線形回帰モデルについて取り組んでいこうと思います。 実行環境 Python3 MacBook Air(端末) Jupyter Lab(Chrome) 本記事の概要 1.背景、目的 2.データの取得、前処理 3.モデル構築 4.モデル評価 5.結論 本編 1.背景、目的 前回の記事でSQLの実践を兼ねてbigqueryの一般公開データセットにあるChicago Taxi Tripsというデータから、SQLを記述してデータを取得してみるということを行いました。 アメリカ・シカゴ市のタクシー利用に関するデータがまとめられています。 前回ではデータからアメリカのチップ文化を知るというのが大きな目的でした。 前回の記事 最後の分析のところで、乗車距離が長い

                                                                                  【scikit-learn基礎】実際に線形回帰モデルを構築する - Qiita
                                                                                • Amazon.co.jp: scikit-learn、Keras、TensorFlowによる実践機械学習 第2版: Aurélien Géron (著), 下田倫大 (監修), 長尾高弘 (翻訳): 本

                                                                                    Amazon.co.jp: scikit-learn、Keras、TensorFlowによる実践機械学習 第2版: Aurélien Géron (著), 下田倫大 (監修), 長尾高弘 (翻訳): 本

                                                                                  新着記事