azure-cosmosdb-table パッケージのインストール
Python から Azure Table Storage を操作するには、azure-cosmosdb-table
というライブラリを使用します。
Cosmos DB をまったく使わない場合でも cosmosdb と名前のついたライブラリを使わせようとするのは、 Microsoft の策略 Cosmos DB に力を入れているという意思表示でしょう。
正直なところ Cosmos DB はお金がかかりすぎて個人の趣味レベルでは使えないのですが。。。
(追記: 2021年)CosmosDB に無料枠ができて少しずつ個人利用もできそうな感じになってきました。
TableService オブジェクトの生成
Azure Storage にアクセスするには、接続情報(ストレージアカウント名とキー)が必要になるので、Azure ポータル で確認しておいてください。
Table Storage にアクセスしてごにょごにょするには、TableService クラス のメソッドを使用します。
TableService
のコンストラクタには、ストレージアカウント名とキーを渡します。
TableService
クラスがよろしくやってくれるので、実装コードがとてもスッキリします。
ストレージアカウント名は Azure 内(世界中)で一意になっているので、ストレージアカウント名さえ指定すれば、Web API の URL も自動的に決まるということですね。ストレージアカウントのキーを環境変数から取得する
ストレージアカウントにアクセスするためのキー情報をスクリプト内にハードコーディングするのは望ましくないので、環境変数などから取得するようにしておくとよいでしょう。
プロキシ環境からアクセスする場合
TableService
クラスをプロキシ環境内で使用する場合は、OS の https_proxy
環境変数で設定してしまうのが簡単です。
OS の https_proxy
環境変数を設定するのを避けたいときは、Python スクリプトの中からプロキシを設定してしまうこともできます。
OS の https_proxy
環境変数を設定するのも嫌だし、Python スクリプト内にプロキシ情報をハードコードするのも嫌なときは、例えば、独自の AZURE_PROXY
のような 独自の環境変数 を用意して、その値をプロキシ情報として使用するという方法があります。
テーブルの操作
ここから先のテーブル操作に関しては、前述の TableService
オブジェクトの生成が終わっていることを想定しています。
テーブルのリストを取得する (list_tables)
Table Storage 上に存在するテーブルの一覧を取得するには、TableService
クラスの list_tables() メソッド を使用します。
このメソッドの戻り値を for ループで処理すると、azure.cosmosdb.table.models.Table オブジェクトを 1 つずつ取り出すことができます。
テーブル名を示す name
プロパティしかありませんが。。。
仮に、books
と todos
というテーブルが作成済みであれば、次のように表示されます。
テーブルの存在を確認する (exist)
Table Storage 上に、指定した名前のテーブルが存在するかどうかをチェックするには、TableService
クラスの exists() メソッド を使用します。
テーブルを作成する (create_table)
Table Storage 上に、新しいテーブルを作成するには、TableService
クラスの create_table() メソッド を使用します。
テーブルの作成に成功すると True
を返します。
テーブルを削除する (delete_table)
Table Storage 上の、既存のテーブルを削除するには、TableService
クラスの delete_table() メソッド を使用します。
テーブルを削除すると、そこに含まれているすべてのエンティティも削除されてしまうので注意してください。
エンティティの操作
テーブルにエンティティを追加する (insert_xxx)
指定したテーブルにデータ(エンティティ)を追加するには、TableService
クラスの下記のいずれかのメソッドを使用します。
同じキー情報を持つエンティティを追加しようとしたときの振る舞いだけが異なります。
- insert_entity()
- テーブル内に既に同じ
PartitionKey
とRowKey
を持つエンティティがある場合は、例外を発生します。 - insert_or_merge_entity()
- テーブル内に既に同じ
PartitionKey
とRowKey
を持つエンティティがある場合は、指定したプロパティだけ上書きされます(既存エンティティのプロパティとマージされる)。 - insert_or_replace_entity()
- テーブル内に既に同じ
ParitionKey
とRowKey
を持つエンティティがある場合は、指定したエンティティに置き換えられます。
これらのメソッドのパラメータはすべて同じで、追加先のテーブル名と、追加するエンティティを渡します。
entity
パラメータには、辞書オブジェクトか Entity クラス のオブジェクトを渡すことができます。
別に Entity
オブジェクトを使ったところで型安全になるわけでもないので、辞書オブジェクトをそのまま使った方が楽かもしれません。
insert
系メソッドでエンティティを追加するときに、テーブルにまだ存在しないプロパティを指定することもできます。
その場合、自動的にテーブルにそのプロパティが追加されるので、プロパティ名は間違えないように要注意です。指定したキーのエンティティを取得する (get_entity)
取得したいエンティティのキー(PartitionKey
と RowKey
)が分かっている場合は、TableService
クラスの get_entity() メソッド を使って Entity
オブジェクトを取得することができます。
指定したキーのエンティティが見つからない場合は、例外が発生します。
特定のプロパティしか参照しないことが分かっている場合は、select
パラメータでプロパティ名を列挙しておくと、通信量を節約することができます。
指定したキーのエンティティを削除する (delete_entity)
指定したキー(PartitionKey
と RowKey
)のエンティティを削除するには、TableService
クラスの delete_entity() メソッド を使用します。
指定したキーのエンティティが見つからない場合は、例外が発生します。
エンティティのリストを取得する (query_entities)
テーブルから条件に一致するエンティティをすべて取得するには、TableService
クラスの query_entities() メソッド を使用します。
検索条件は、filter
パラメータを使って指定することができます。filter
パラメータには文字列でフィルタ条件を指定するのですが、どのようなフォーマットで指定すればよいかは、下記のサイトが参考になります。
- 参考: Querying tables and entities (REST API) - Azure Storage | Microsoft Docs
- 参考: Azure ストレージ テーブルの設計パターン | Microsoft Docs
例: PartitionKey が Python である
filter
パラメータに ParitionKey eq 'Python'
と指定すると、PartitionKey
が Python
であるエンティティをすべて取得することができます。
例: RowKey が 0002 より大きい
filter
パラメータに RowKey gt '0002'
と指定すると、RowKey
が 0002
よりも大きいエンティティのみを取得することができます。
バッチ処理化
複数のエンティティを追加したい場合などは、バッチ処理で行うようにすると、サーバーとの通信回数を減らすことができます。
バッチ処理を行うには、TableService
クラスの batch() メソッド を使用します。