Uncategorized, プログラミング, 機械学習

Jupyter Labは、Jupyter notebookの後継となるデータサイエンス向けの統合開発環境(IDE)です。Jupyter Labのインターフェースを、機械学習や科学計算をやり始めたプログラミング初学者にとっても扱いやすいように(RstudioやSpyderっぽく)設定したいと思います。

機械学習, 科学

後々練習用で使えそうな機械学習やケモインフォマティクスのデータセットをリストアップしておく。

プログラミング, 機械学習

nvidia-docker 2.0を導入するには、いくつかのインストール要件を満たしておく必要があります。

インストールする前に何を揃えておく必要があるか、
前提条件の確認方法と導入方法について記します。

詳細は公式ドキュメント参照:

前提条件の確認方法

インストールに必要な要件は以下の4つ。

GNU/Linux x86_64 kernel v ...

プログラミング, 機械学習

BLASはnumpyの実際の処理を担っており、scipyやtensorflow等の高速化にも重要です。numpyをcondaとpipどちらで入れるかによっても使われるBLASも変わってきます。「BLASの違いによる計算処理の速度差」や「自分の環境でどのBLASが入っているか調べる方法」について簡単にまとめます。

プログラミング, 機械学習, 科学

PythonでDataFrame中の時系列・スペクトルデータを間引きたい時の方法です。

「pandas.DataFrame.resample」だと引数でD(日次)、W(週次)などの時間設定をしないといけません。日時の列がない時系列データやスペクトルデータの間引きたい時は以下の方法が使えます。

時系列・スペクトルデータとは

時系列・スペクトルデータとは、ある軸に沿って一定 ...

機械学習

きっかけ

もともとグラフィック処理の重いPCゲーム(The Witcher 3やWatch Dogsなど)で遊んでいましたが、最近やる頻度が減ってきています。

持て余したスペックの再利用も兼ねて、ゲーム、機械学習・深層学習に使えるように自作パソコンを組み立て直しました。

おすすめのパーツや選定理由も記しておきます。

パーツの購入先

ヤフオク、Amazon、ヨド ...

機械学習

分子記述子(molecular descriptor)とは

その分子の特徴を化学構造に基づいて、数値として表わした値。記述子計算の際に考慮する化合物空間よって、記述子のタイプは0-4次元に区別される。

次元数別の記述子一覧次元数記述子具体例0D構造記述子
カウント記述子分子量、結合数
C,H,O,N等の原子数1Dフラグメント数
Fingerprints特定の部分構 ...

機械学習, 科学

1つの化合物に対してCAS番号(CAS No.)やIUPAC Nameを入力するとSMILESを出力してくれるサイトは多数ありますが、たくさんのリストになっている場合を1つ1つ入力して変換するのは不可能です。この記事では数千コ単位で含まれる化合物表記のリストをSMILESかInChI Keyに一括変換する方法を紹介します。

ChemCellとは

ChemCellは、Microsof ...