-
プログラミング入門
【C#】文字列の類似度をN-gramとコサイン類似度で求める
時々ですが、仕事の関係で2つの文字列がどれくらい一致するかを数値で表したくなることがあります。 この記事に辿り着いたあなたは、きっと私と同じ思いをされていることでしょう。 文字列の類似度といえば、レーベルシュタイン距離や、ジャロ・ウィンク... -
プログラミング入門
【WPF】 C#を使ったcsv読み込みとグラフ化のサンプル!
今回は、CSVファイルの読み込みとグラフ化をテーマに取り上げたいと思います。 「CSVファイルの読み込み」⇒「DataGridで表示」⇒「グラフの表示」という一連の操作をC#とWPFを使ってプログラムしています。 それぞれの処理は関数化しているので、必要な個... -
プログラミング入門
【簡単・高精度】c#で処理時間を計測しよう
プログラミングをしていると、たまに処理時間を計測したくなるときがありますよね。 今回は、C#を使って処理時間を計測するための Stopwatch クラスについて、その使い方について解説したいと思います。 各メソッドの違いや計測結果の取得方法ついて、いま... -
SQL入門
【図で理解】SqlServer(SQL Database)のパーティション化を分かりやすく説明!
巨大データなデータをSQL Server(又はAzure SQL Database)で扱う場合、パーティション化(パーティショニング)するという方法が思いつきます。 しかし、マイクロソフトのサイトをググってもイマイチ分かり難くありませんか? その他にもいくつかのサイ... -
プログラミング入門
【超便利】C# Math.NET で統計計算をしようよ!
C#で最大、最小、中央値、標準偏差、分散、四分位などの統計情報を計算する際、Math.NET というフリーのライブラリが良く使われます。 今回は、この Math.NET のインストール方法と使い方、そして簡単な関数のサンプルを作ったてみたので、それらを合わせ... -
Python機械学習
【実践】PythonとBERTで感情分析しようよ!
前回は、形態素解析器の Janome と日本語評価極性辞書を使って、文書による感情分析を行いました。 今回は、BERT という自然言語処理モデルを使った感情分析について紹介したいと思います。 今回もクラス化しているので、コピペですぐにお試し頂けるように... -
プログラミング入門
【実践】PythonでWordCloud(ワードクラウド)しようぜ!
前回、前々回の記事で、Pythonを使った文書の要約について紹介致しました。 これは、長文から重要な部分を抜き出すことで、文書全体の概要を素早く理解しようという試みです。 一方、単語の登場数に応じて文字のサイズを大小させて視覚化することにより、... -
プログラミング入門
【実践】Python+pysummarizationで文書要約(テキストマイニング)しよう!
前回の記事に引き続き、今回は Python + pysummarization という組み合わせで文書要約をしてみます。 ニューラルネットワーク言語モデルを使用しているという事なので、sumy との要約結果の違いも気になるところです。 sumy よりも使い方が簡単なので、今... -
プログラミング入門
【実践】Python+sumyで文書要約(テキストマイニング)しよう!
例えば、気に入った商品の評価を知るためにAmazonの口コミを探したら、大量のコメントが書かれていたりとか、調べものをググって辿り着いたWebサイトに大量の文書が書かれていた場合、それらに全て目を通すのって大変ですよね。 有難いことに、Pythonを使... -
プログラミング入門
IPAフォントのダウンロード方法と使い方
IPAフォントとは、一般社団法人「文字情報技術促進協議会」が公開している無料の日本語フォントです。 Windowsアプリを Visual Studio で開発する場合は、ほとんど使う機会はありませんが、海外製のライブラリ、特にPythonのライブラリでたまに使う場合が...