NotionAIで遊んでみる - たけぽん( ..)φメモメモ

NotionAIはNotionの中で使えるChatAIです

日記的なメモです、NotionにはNotionAIという自動的にメモを保管してくれるAIが実装されています。では早速AIに「ニシナガレについて紹介して」とコマンドを出してみましょう。横に縦棒がある部分がAIからの回答です。

「ニシナガレについて紹介して」

このバンドは、2010年に結成された4人組のロックバンドです。メンバーは、ボーカルの西永達也、ギターの山田太郎、ベースの鈴木次郎、ドラムの田中花子となっています。彼らの音楽は、激しいギターのリフと西永達也の情熱的な歌声が特徴的で、オリジナリティ溢れるサウンドが聴き手を魅了します。
バンド名の由来は、メンバーの西永達也の名字からきています。彼は、自分の名字が珍しいこともあって、バンド名に使うことを提案しました。西永達也は、バンドのリーダー的存在であり、音楽の制作やバンドの方向性についても積極的に意見を出しています。
2012年には、メジャーデビューを果たし、以降も精力的に音楽活動を続けています。彼らの楽曲は、多くの人々に支持され、数々のヒット曲を生み出しています。
ニシナガレは、独自のサウンドと情熱的なライブパフォーマンスで、多くの音楽ファンから愛されています。今後も彼らの音楽活動から目が離せません。

……えっと。誰だよ。特に赤線部分の断定っぷりはぱねえな！

ニシナガレは、5人組のバンドです。メンバーは上の図の左から、かっぺー、たけぽん、おーさま、かつらちゃん、うにゃさんです。

まぁ、マイナーですからね。分からないと言ったら負けの人のように創作してくれましたｗ

以前試したときは、も少し惜しい表現で説明してくれたのですが。あれはBingだったかしら。まぁ、とりあえず、こういうものでのAIの説明は微妙なんですかね。でも、AIは本当はもっとやばいくらいに便利ですしイノベーションなんです。本当はそういう記事を書きたかったのですけどね(/・ω・)/

ChatGPTのサイトでは、途中までのやり取りを保存しておいて、そこからAIとの会話を再開できるようにもなっています。それによって、プログラムを作るときの、ソースへのダメ出しや修正も文句を言わずに何度も実行してくれたりして、その結果、ちゃんとスキなくそつなく動くプログラムを作ることも可能なんです。これからの子供たちには、AIにどのようにオーダーすべきか、どう付き合うべきかを教えたほうが良いのではないでしょうか。

「notionAIの売りを熱く語ってください。ハイテンションで楽しそうにお願いします」

NotionAIは、あなたの生産性を爆発的に高めることができます！もう手動でメモを取る必要はありません。NotionAIに頼れば、自動的にメモを取ってくれます！そして、それだけではありません！NotionAIは、あなたが必要な情報を簡単に見つけるのを手助けするだけでなく、あなたが求める情報を提供することができます！もう検索エンジンで時間を無駄にする必要はありません。NotionAIに頼れば、あなたの仕事の効率を最大化することができます！NotionAIの便利さに感動して、もう手放せません！NotionAIを使えば、あなたも生産性の高い人材になれます！

「pytesseractライブラリを使って、数字を読み取りたいが精度が低いため画像ファイルを用意して学習させたい。その方法とPythonプログラムを作成してください」

以下は、pytesseractライブラリを使用して、数字を読み取るためのPythonプログラムです。このプログラムは、画像ファイルを読み込み、テキストファイルに数字を書き出します。
import pytesseract
import cv2
import numpy as np

# 画像ファイルを読み込む
img = cv2.imread('image.png')

# 画像をグレースケールに変換する
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 画像を2値化する
_, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

# ノイズを除去する
kernel = np.ones((3, 3), np.uint8)
opening = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=2)
sure_bg = cv2.dilate(opening, kernel, iterations=3)

# 文字列を読み込む
config = '-c tessedit_char_whitelist=0123456789 --psm 10'
text = pytesseract.image_to_string(sure_bg, config=config)

# 結果をファイルに書き出す
with open('result.txt', 'w') as f:
    f.write(text)
ご提供いただいたPythonプログラムは、pytesseractライブラリを使用して画像から数字を読み取るためのものです。プログラムの流れは、まず画像を読み込んでから、グレースケールに変換して、2値化することで画像を整えます。そして、ノイズを除去し、文字列を読み込みます。最後に、結果をファイルに書き出します。

ただ、ご説明にある通り、pytesseractライブラリの精度には限界があります。精度を上げるためには、学習データを追加する必要があります。学習データは、画像から文字を読み取るためのルールを学習するためのもので、多くのサンプル画像が必要です。
学習データを作成するには、まず、OCRエンジンを訓練するための学習用画像を収集する必要があります。学習用画像は、OCRエンジンが認識する必要のある文字を含むもので、フォント、フォントサイズ、スタイル、色などの様々な要素を含める必要があります。学習用画像を収集したら、OCRエンジンを訓練し、学習済みモデルを作成します。
学習済みモデルを使用すると、より高精度なOCR処理が可能になりますが、学習用画像の収集やモデルの訓練には、時間と労力が必要になります。また、学習用画像の収集には、著作権に関する問題もありますので、適切に注意する必要があります。
以上のことを踏まえ、必要に応じて学習データの収集やモデルの訓練を行い、pytesseractライブラリの精度を向上させることができます。

後半の説明はグダグダで解説方法までは至っていませんが、この後、「具体的に教えて」とかコミュニケーションを取り話すことで解決につながることもあります。根気があれば最終的には正解に近づく感じですね。あくまでも「近づく」なので、やっぱりソースコードを読めてレビューできるくらいのスキルは必要です。