【実用】WindowsのPythonからSQLiteを使う

当ページのリンクには広告が含まれています。

Python をインストールすると、もれなくSQLiteが付いてきます。

つまり、Pythonにとって、SQLiteは標準データベースなんですね。

しかし、Pythonの公式サイトは今一分かり難いし、かと言ってネットでググっても断片的な情報しか出てきません。

そこで、この記事では実際のアプリで使う事を前提に、必要となるメソッドと使い方について解説したいと思います。

SQLiteに関する特徴や仕様、実用上の注意点を理解しておきたい方は、「【ポイント解説】知っておきたいSQLiteの仕様と注意事項」をご一読下さい。

一通りの機能をクラス化して「【コピペで完了】9割の機能を網羅!PytonからSQLiteを扱うクラスを作ってみました。」の記事で公開していますので、すぐ使いたい方は合わせてご覧下さい。

目次

最初の準備

Pythonをインストールすると標準でSQLiteがインストールされています。

単純にインポートすればOKです。

データベースの作成

SQLiteのデータベースは単一ファイルで構成されており、データベースの作成は connect メソッドを呼ぶだけで完了します。

sqlite3.connect(ファイル名)

このメソッドを呼ぶと、既にデータベースファイルが存在していればデータベースに接続し、存在しなければ新しくデータベースを作成してくれます。

ファイル名の代わりに ‘:memory:’ という文字列を指定すると、メモリ上にデータベースが構築されます。

いわゆるインメモリデータベースです。

メモリに余裕があり、高速な処理を行いたい時には有効ですが、close メソッドを呼ぶと内容が消えてしまいますので、あくまでも一時的な使い方に適しています。

話は変わりますが、この connect に関して2点ほど注意点があります。

close 処理は忘れずに

1つ目は、close 処理の問題です。

connect メソッドを呼ぶとコネクションクラスのインスタンスが生成されます。

一般的にはこのまま放置していても問題ありませんが、多少なりともメモリを消費してしまうため、あまり良い事ではありません。

connect メソッドを呼んだら、そのインスタンスを使って closeメソッドを呼び出すことを心がけましょう。

パスの区切り文字はスラッシュ’/’が無難

Windowsの場合、パスの区切りは ‘¥’ マークを使いますので、Pythonでも ‘D:\notepc.db’ の様に’ ¥’ マークを使ってしまいがちです。

既にデータベースが存在していれば問題ありませんが、存在しなければエラーになって作成してくれません。

Python では スラッシュ ‘/’ も区切り文字として使えますので、こちらを使用すると問題なく新規作成してくれます。

データベースの操作

SQLiteのデータベースを操作する場合、「DBに接続」「カーソルを取得」「SQLの実行」「カーソルを閉じる」「接続を閉じる」という手順が必要です。

この章では、テーブル作成やテーブル名変更などを行うSQL、いわゆるDDL (Data Definition Language)と、テーブルへのデータの挿入/変更/削除を行う場合の2パターンについて、それぞれ解説します。

DDL(Data Definition Language)を実行する場合

DDLはトランザクションが効かないので、コミットやロールバックを行う必要はなく、省略することが可能です。

従って次のように書くことが出来ます。

カーソルを取得せず、connに実装されているexecute メソッドを使っても同じことが出来ます。

実は、conn.execute を実行するとカーソルのインスタンスが返され、メモリに残ったままになります。

一般的な使い方では問題ありませんが、前述の様に明示的にカーソルを取得して使い終わったらclose するという書き方の方が良いでしょう。

データの挿入/変更/削除を実行する場合

こちらはトランザクションを掛けることが前提となるため、コミットが必要になります。

ちなみに、Pythonの場合、特に指定しない限りconnectメソッド実行と同時にトランザクションが開始されています。

もちろん、DDLを実行した後にコミットをしても問題ないので、DDLとデータの挿入/変更/削除を連続して行わせても構いません。

ちなみに、エラーが発生したり、処理を中断した時に元に戻したい時は、conn.rollback() メソッドを使います。

データベースの作成

データベースを作成するには、sqlite3.connectメソッドを使います。

  conn = sqlite3.connect(データベースファイル名)

テーブルの作成と削除

テーブルの作成や削除はDDLであるため、直接コネクションのインスタンスからSQLを実行できます。

ここでは、コネクションを使う方法とカーソルを使う方法の2通りについてサンプルを提示しておきます。

また、テーブルの削除についても同様に次のように記述できます。

もちろん、テーブル名を変更する ALTER TABLE 、Viewを作成する Create Viewについても同様に2通りの手順が使用できます。

データの登録/変更/削除

テーブルに対してデータの登録/変更/削除を行う場合はトランザクションを利用します。

といっても、connect メソッドと同時にトランザクションが開始されているため、必要なSQLを実行し終えた段階で commit 又は rollback メソッドを呼び出すだけです。

言い換えると、commitを実行しないとデータの変更は行われません。

Insert

以下はインサートのサンプルです。

delete

下記は削除のサンプルです。

update

下記は更新のサンプルです。

データの検索/集計

データを取得する場合は、コミットの代わりにフェッチ(fetch~)を使います。

fetchall は条件に合致したデータを全て読み込むメソッドですが、一度にメモリに入りきらない可能性もあるため、1行又は複数行づつ取り出すメソッドが用意されています。

fetchall/fetchone/fetchmany

データの取り出し(フェッチ)メソッドは3種類用意されています。

機能メソッド備考
全件取得fetchall()リスト形式で全件を返す。
1件づつ取得fatchone()データがあれば1行をタプル形式で返す。
データが無くなれば None を返す。
指定件数づつ取得fetchmeny(件数)

fetchallはタプルを要素としたリスト形式で結果を返します。

fetchone は1行だけタプル形式で返します。

戻り値が None になるまでループすることで全件を取り出せます。

fetchmeny は fetchall と同様にタプルを要素としたリスト形式で指定件数づつ返します。

取り出すデータが無くなれば空のリスト [] を返すので、次のようなループで全件を取り出す事が出来ます。

カーソルから直接取り出す(イテレータ)

カーソルはイテレータなので、forループで全件を取り出すことが可能です。

fetchone よりもこちらの方がスマートに記述出来ます。

どちらかというと、ループで1件づつ処理したい場合はカーソルを使い、先頭の1行だけ取り出したい場合は fetchone を使うのが良さそうです。

集計処理

集計処理についても基本的に結果がリスト形式で返されます。

select count(*) from ~ の様に値が1つしか返さない場合であっても、戻り値のフォーマットは同じです。

トランザクションモード

connect メソッドの isolation_level 引数に下記表の設定値を渡すことで、トランザクションにおけるロックの種類を指定することが出来ます。

  sqlite3.connect(ファイル名,isolation_level=設定値)

分離レベル
(isolation_level)
設定値内容
deferred‘DEFERRED’読み込み処理時にSHARED ROCKを、書き込み処理時にRESERVED ROCKを取得
immediate‘IMMEDIATE’開始時にRESERVED ROCKを取得
exclusive‘EXCLUSIVE’開始時にEXCLUSIVE ROCKを取得
auto commitNoneトランザクションをしない。
言い換えると、SQLを1つ実行する度に commit する。

ロックに関する詳細については、SQLite公式サイトに記載されています(但し英語です)。

下記は公式サイトの内容を簡単に要約したものです。

UNLOCKEDデータベースにはロックが保持されておらず、データベースの読み取りも書き込みも不可。
初期値はこれ。
SHAREDデータベースは読み取り可能だが、、書き込みはできません。
任意の数のプロセスが同時にSHAREDロックを保持できるため、多数の同時リーダーが存在する可能性があります。
ただし、1つ以上のSHAREDロックがアクティブな間は、他のスレッドまたはプロセスがデータベースファイルに書き込むことはできません。
RESERVEDデータベースファイルへの書き込みを予定しているが、現在はファイルからの読み取りのみを行っている状態。
複数のSHAREDロックを1つのRESERVEDロックと共存させることはできるが、一度にアクティブにできるRESERVEDロックは1つだけ。
PENDINGロックを保持しているプロセスができるだけ早くデータベースに書き込みを行い、現在のすべてのSHAREDロックがクリアされるのを待ってEXCLUSIVEロックを取得できることを意味します。
EXCLUSIVEデータベースファイルに書き込むには、EXCLUSIVEロックが必要。
ファイルには1つのEXCLUSIVEロックのみが許可されており、他のいかなる種類のロックもEXCLUSIVEロックと共存することはできない。

トランザクションの有無による速度比較

PythonのSQLite では、sqlite3.connect の引数になにも指定しない場合、トランザクションが自動的に実行されます。

isolation_level という引数を None にすることで、トランザクションを無効にすることが可能です。 

そこで、トランザクションの有り無しでどれくらい差がでるのかを調べてみました。

ついでに、興味本位でコネクションのexecute と カーソルの execute についても速度の差があるか調べてみました。

結果は、コネクションのexecute を使った場合で242倍、カーソルのexecuteを使った場合で188倍もの差がありました。

また、コネクションのexecuteを使った方が若干早かったです。

<トランザクション有り>

計測条件1000件インサート時間(10回の平均値)
コネクションのexecute
トランザクション有り
0.153秒
カーソルのexecute
トランザクション有り
0.198秒

<トランザクション無し>

計測条件1000件インサート時間(10回の平均値)
コネクションのexecute
トランザクション無し
37.17秒
カーソルのexecute
トランザクション無し
37.25秒

下記が実験に使ったソースコードです。

まとめ

今回は、WindowsのPythonからSQLiteを使う方法について、SQLiteデータベースの作成、データの挿入/更新/削除、Fetchを使ったループ処理、トランザクション処理について解説しました。

そして、最後にSQLiteで1000件のデータをインサートする際の時間を、トランザクション有りと無しで計測、比較してみました。

SQLiteのインサート処理は、トランザクションをONにするのが定石ですが、実は240倍もの速度差があったんですね。

SQLiteは軽量で気軽に使えるデータベースなので、是非みなさんも活用してみてください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次