stabel diffusion とは…
Stable Diffusion(ステーブル・ディフュージョン)は、2022年に公開されたディープラーニング(深層学習)のtext-to-imageモデルである。主にテキスト入力に基づく画像生成(text-to-image)に使用されるが、他にもインペインティング(英: inpainting)、アウトペインティング(英: outpainting)、テキストプロンプトによって誘導される画像に基づく画像生成(image-to-image)にも使用される。
https://stablediffusionweb.com/prompts
https://stablediffusionweb.com/#demo
prompt
shibuya,crossing,new year,night,
okinawa,beach,colal leaf
Midjourney(ミッドジャーニー)は、テキストの説明文から画像を作成する独自の人工知能プログラムであり、また同プログラムを開発している独立した研究所[1][2]の名称でもある。かつてはクローズドベータ版が運用され、2022年7月13日にオープンベータ版への移行が発表された
Midjourney
midjourney のお作法
カテゴリ | キーワード例 |
画像をキレイに・ハイクオリティに | ・Realistic,photorealistic(写実的に) ・8k,4k(8k,4k画質で) ・Unreal Engine(非現実的に) |
絵・画像の種類 | ・painting(絵画) ・oil painting(油絵) ・watercolor painting (水彩画) ・photograph(写真) ・pencil sketch(鉛筆画) ・sculpture(彫刻) |
絵のトーン | ・ancient(古代風の) ・futuristic(未来的な) ・realistic(リアルな) ・pop art(ポップアート風) ・manga,comic(マンガっぽく) |
画風 | ・in Studio Ghibli style(ジブリ風) ・by Vincent van Gogh(ゴッホ風) ・in ukiyo-e style(浮世絵風) |
※例えば、「dog , tree , sunny」とするより、「A dog is under a tree on a sunny day」としたほうが好ましいです。
https://kigyolog.com/article.php?id=1690
日本語で説明して、DeepLで翻訳もあり。
OpenAI
OpenAI は、人工知能を研究する非営利団体である。人類全体に、害をもたらすよりは、有益性があるやりかたで、オープンソースと親和性の高い人工知能を、注意深く推進することを目的として掲げている
2015年12月に設立された。イーロン・マスクをはじめとする有力な実業家・投資家が参加していることから注目を集める[4]。
2016年4月に強化学習アルゴリズムの検証プラットフォームであるOpenAI Gymを発表した
自然言語処理と画像生成モデル(VAE,Clip)を組み合わせたAI「DALL・E」を発表。人間でも見分けが付かないほど高精度な文章を生成するAI「GPT-3」のパラメータを使用し、文章からイラストや写真を作り出すことができる。
2022年11月、対話型言語モデルChatGPTを発表https://ja.wikipedia.org/wiki/OpenAI
ChatGPTは、AI研究企業のOpenAIによって開発された。同社は米国時間2022年11月30日にChatGPTを公開した。同社は人気の画像生成AIツール「DALL·E 2」や自動音声認識システム「Whisper」も開発している
OpenAIの最高経営責任者(CEO)であるSam Altman氏のツイートによると、30日の公開以来、100万人以上のユーザーがChatGPTを使用したという。Altman氏はMusk氏に対し、1回の応答の平均コストが「10セント未満」であることを明かしたが、「泣きたくなるほどの」計算コストが発生するので、最終的にはChatGPTを収益化する必要があることを認めた。
https://japan.zdnet.com/article/35197140/