Beyond the State-of-the-Art

最先端を超えたいと思ってる(大嘘)エンジニアのブログ

Python

最初のN個の素数を生成する in Python3

Qiitaからの移植です。 最初の 個の素数を生成する方法を何通りか挙げて、計算時間を測定してみました。 素数の生成 素数が入ったlistを返す関数を作ります。 1. 愚直な方法 整数 を で割って素数を判定します。 from math import sqrt def is_prime_simple(…

PythonワンライナーでMySQL実行履歴を読む

Qiitaからの移植です。 はじめに やること MySQL実行履歴は.bash_historyファイルに書かれています。ファイルには show\040databases; のように、UTF-8のエスケープシーケンスが含まれた状態で書いてあります。今回はPythonワンライナーを使って、先程の文字…

PythonでClickHouseのSELECT結果をpandas.DataFrameに入れる

Qiitaからの移植です。 はじめに ClickHouseとはカラム指向型DB管理システムの1つです。日本ではまだまだマイナーな存在【要出典】です。詳しくは、公式サイトを見たり、Qiita内を検索したり、Google先生を頼ったりして、調べてください。 今回は、Pythonで …

KaggleのTitanic問題をFactorization Machinesで解く

Qiitaからの移植です。 Factorization MachinesでKaggleのTitanic問題を解いてみたので、メモとして解いた手順をここに残そうと思います。 Factorization Machinesとは Factorization Machines (FM)は機械学習の手法の1つです。ざっくり説明すると、疎な学習…

Python3の標準入力でUnicodeDecodeErrorに出会ったときの対処法

Qiitaからの移植です。 sys.stdinでUnicodeDecodeErrorに遭遇。 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xed in position XXXX: invalid continuation byte 対処に苦しんだので、対処法をここにメモします。 対処法 まず、Python3でUnicodeDe…

Pythonでベトナム語の形態素解析

Qiitaからの移植です。 仕事でベトナム語に触れる機会があって、ベトナム語の自然言語処理について調べたことがあります。本記事では、そこで知ったPythonのベトナム語の自然言語処理用ライブラリについて話そうと思います。ところで、日本でベトナム語の自…

Python+Flaskでテーブル定義書を自動生成するWebアプリケーションを作ってみた

Qiitaからの移植です。 概要 データベースのテーブル定義書を自動的に生成して、ブラウザ上で確認できるWebアプリケーションを作成しました。自動生成によって、テーブル定義が更新されたときに、手動でドキュメントを更新する手間を省きます。もちろん、こ…

pytestでassertion用ライブラリassertpyを使ってみる

Qiitaからの移植です。 Pythonのユニットテストで、Python標準のunittestを使わずに、pytestを使うことを考えましょう。つまり、テストコードではunittest.TestCaseを継承したクラスを作りません。この場合、unittestに入っている様々な用途に応じたassertio…