-
プログラミング入門
【超便利】WindowsのPythonとGiNZAで形態素解析だ!辞書登録とMeCab形式出力も解説!
これまでに、MeCab と janome を使った形態素解析について紹介してきました。 今回は、GiNZAを使った形態素解析について紹介します。 ついでに、ユーザー辞書の登録方法と、解析結果をMeCab形式で出力するための方法についても触れていますので、興味のあ... -
プログラミング入門
【実践】PythonとGiNZAで係り受け解析しようか!
以前、「【超簡単】windowsのpythonとmecabで形態素解析しようぜ!」 の記事と「 【超簡単】windowsのpythonとjanomeで形態素解析しようぜ!」 の記事で形態素解析についての方法を紹介しました。 形態素解析を行うことで、単語の区切りが分りづらい日本語... -
プログラミング入門
【C#】文字列の類似度をN-gramとコサイン類似度で求める
時々ですが、仕事の関係で2つの文字列がどれくらい一致するかを数値で表したくなることがあります。 この記事に辿り着いたあなたは、きっと私と同じ思いをされていることでしょう。 文字列の類似度といえば、レーベルシュタイン距離や、ジャロ・ウィンク... -
プログラミング入門
【WPF】 C#を使ったcsv読み込みとグラフ化のサンプル!
今回は、CSVファイルの読み込みとグラフ化をテーマに取り上げたいと思います。 「CSVファイルの読み込み」⇒「DataGridで表示」⇒「グラフの表示」という一連の操作をC#とWPFを使ってプログラムしています。 それぞれの処理は関数化しているので、必要な個... -
プログラミング入門
【簡単・高精度】c#で処理時間を計測しよう
プログラミングをしていると、たまに処理時間を計測したくなるときがありますよね。 今回は、C#を使って処理時間を計測するための Stopwatch クラスについて、その使い方について解説したいと思います。 各メソッドの違いや計測結果の取得方法ついて、いま... -
SQL入門
【図で理解】SqlServer(SQL Database)のパーティション化を分かりやすく説明!
巨大データなデータをSQL Server(又はAzure SQL Database)で扱う場合、パーティション化(パーティショニング)するという方法が思いつきます。 しかし、マイクロソフトのサイトをググってもイマイチ分かり難くありませんか? その他にもいくつかのサイ... -
プログラミング入門
【超便利】C# Math.NET で統計計算をしようよ!
C#で最大、最小、中央値、標準偏差、分散、四分位などの統計情報を計算する際、Math.NET というフリーのライブラリが良く使われます。 今回は、この Math.NET のインストール方法と使い方、そして簡単な関数のサンプルを作ったてみたので、それらを合わせ... -
Python機械学習
【実践】PythonとBERTで感情分析しようよ!
「【実践】Pythonとjanomeで感情分析しようよ!」の記事では、形態素解析器の Janome と日本語評価極性辞書を使って、文書による感情分析を行いました。 今回は、BERT という自然言語処理モデルを使った感情分析について紹介したいと思います。 今回もクラ... -
プログラミング入門
【実践】Pythonとjanomeで感情分析しようよ!
前回はTF-IDFを使った文書の特徴抽出について紹介しましたが、今回は Python を使った文書の感情分析について、その方法をご紹介したいと思います。 今回もクラス化しているので、コピペですぐにお試しいただけます。 さっと試してみたいという方は、是非... -
プログラミング入門
【実践】PythonでWordCloud(ワードクラウド)しようぜ!
前回、前々回の記事で、Pythonを使った文書の要約について紹介致しました。 これは、長文から重要な部分を抜き出すことで、文書全体の概要を素早く理解しようという試みです。 一方、単語の登場数に応じて文字のサイズを大小させて視覚化することにより、...