タグ

関連タグで絞り込む (815)

タグの絞り込みを解除

tipsに関するko-ya-maのブックマーク (2,457)

  • 続・FramePack動画生成(Windows)|青猫

    前回は手元のPython3.13で無理矢理インストールしたんですが、これだと各種高速化の仕組みが利用できないので、ちゃんと正規の手順でインストールしていきます。 ついでに、そういう高速化の対応も解説してみます。 インストールまずはGitHubのページに行って…… Windows用のワンクリック版パッケージがあるのでダウンロードしてきます。(昨日はまだ無かったよ!) 1.7GBくらいの圧縮ファイルです。ダウンロードした圧縮ファイルを解凍します。 (これにはGitPythonのポータブル版が同梱されてるのでPythonのバージョンとか気にしなくてOKなのです) 解凍したら中にある「update.bat」を実行します。(gitの更新だけだからすぐ終わる) 次に「run.bat」を実行するとモデルのダウンロードが始まって、しばらく時間が経った後に起動されます。(2回目以降はそんなに時間かからない

    続・FramePack動画生成(Windows)|青猫
  • 4 ステップでモダンな tsconfig.json を作る - mizdra's blog

    tsconfig.json を使うと、型チェックを緩く/強くしたり、また出力する JS の形式を変えたりできる。しかしいくつかの事情から、正しく書くのが難しい。 オプションの数が非常に多い その数なんと 133 個 *1 オプションの意味や役割が理解しにくい 公式ドキュメントは丁寧にかかれているが... JavaScriptTypeScript の仕様、型の知識、歴史的経緯などを知らないと理解しづらい 推奨されるオプションが変わっていく 言語やエコシステムの進化/変化によって変わる 最近だと Node.js の TypeScript サポートで変わった 「オプションの細かい意味とかは一旦いいから、モダンで最小限の tsconfig.json がすぐに欲しい!!!」。そうした声に応えて、id:mizdra がオススメする「4 ステップでモダンな tsconfig.json を作る方法」

    4 ステップでモダンな tsconfig.json を作る - mizdra's blog
  • Cline(Roo Code)を暴走列車にしたら4日間で数ヶ月分のコードが生成できた

    アイコンが変わったerukitiです。最近はやりのgpt-4o image generationを使って、顔だけだったアイコンに全身が追加されました。2023年4月10日に初めてのLLMプロダクトの開発キックオフからもうすぐで二年です。rat yearなこの業界なんで、変化がめまぐるしすぎますね。 今回は、真に高速なAIコーディングのメソッドを確立するために、中規模くらいのコードをコーディングエージェントのみに書かせる実験をしています。コーディングエージェントはCline派生であるRoo Code(以後Rooと呼ぶ)を使っています。 ※完全に個人研究としてやっているため、会社のリソースは使っていません。 作っているものはコーディングエージェントのコアライブラリ + おまけのCLI 規模としては136ファイル・26410行(一時期30000行弱までいった) なぜコーディングエージェントを使っ

    Cline(Roo Code)を暴走列車にしたら4日間で数ヶ月分のコードが生成できた
  • 【ComfyUI 中級】 VRAM を制御して最高の性能を引き出す設定!|きまま / Easygoing

    はじめにこんにちは、きまま / Easygoing です。 今回は ComfyUI 中級編で、ComfyUI のベストなセッティングを考えます。 初級編 ComfyUI は速い!私が Stable Diffusion webUI Forge から ComfyUI に移行したとき、最初に驚いたのは 動作の速さ でした。 それまで使っていた Stable Diffusion webUI Forge も軽快に動作していましたが、ComfyUI は工程がリアルタイムで表示されて 常に VRAM と RAM の使用量を確認 できるので、さらに最適化を行うことができます。 ComfyUI は、最適なセッティングを行えば、Flux.1 / SD 3.5 / AuraFlow は VRAM 12GB、SDXL は VRAM 6 GB で動作します! ここから、ComfyUI の設定のベストプラクティスを探

    【ComfyUI 中級】 VRAM を制御して最高の性能を引き出す設定!|きまま / Easygoing
  • 画像生成AIの目のプロンプト集(効果のあったものだけ画像あり)|はいぱーさんかく

    混乱 wide-eyed button_eyes mechanical_eye spiral-only_eyes squiggle_eyes 怒り ringed_eyes crazy_eyes bloodshot_eyes bulging_eyes evil_eyes creepy_eyes too_many_eyes evil_eye_sigma square_eyes 悲しい crying_with_eyes_open まゆげ・まつげ v-shaped_eyebrows raised_eyebrows colored_eyelashes raised_eyebrow eyebrow_cut 不気味 empty_eyes rolling_eyes blank_eyes solid_oval_eyes extra_eyes solid_circle_eyes solid_eyes holl

    画像生成AIの目のプロンプト集(効果のあったものだけ画像あり)|はいぱーさんかく
  • bashでset -xしたときの出力をmask

    #!/bin/bash # 出力先のFD5に、sedで「ABCD1234」を****に置換する処理を設定 exec 5> >(sed 's/ABCD1234/****/g') export BASH_XTRACEFD=5 set -x # ここ以降のset -x出力内の「ABCD1234」がマスクされる echo "APIキーは ABCD1234 です"

    bashでset -xしたときの出力をmask
  • Claude.aiをつかって画像内の文字を正確に抽出する方法を見つけました - Qiita

    例えば、こちらのブログですが、グラフィカルな解説部分が、画像になっています。 Claudeはマルチモーダルに対応しているので、画像を添付した状態で「文字を抽出して」というと文字を抽出してくれますが、日語で要約して回答したり、元の文章を正確に抽出する のは、意外と難しいと感じていました。 以下は、Claude.aiを使って「添付画像から文字を抽出して」と依頼した際の結果です。 原文そのままを正確に抽出したいときってありますよね?それを解決する方法を編み出しました。 方法は、「 HTMLで再現させる 」です! 投稿の先頭の画像を添付して「添付画像をHTMLで再現して」と依頼した際の結果がこちらです。 感動!!! (注:右側が画像をもとに生成したHTMLを、プレビューした状態です。Claude.aiのArtifactsという機能です) アイコンがちょっと違うとか省略されてるとかはありますが、

    Claude.aiをつかって画像内の文字を正確に抽出する方法を見つけました - Qiita
  • 【日本語教育能力検定試験音声対策】撥音「ン」の発音をわかりやすく!

    さあ、今回でいよいよ最後、「ン」についてみていきたいと思います。 しかし「ン」は特殊音素として扱われるので特殊音素とタイトルを変えてみていきます。 僕の中で、いままで例外といってきた音は、IPAで表した時の記号が「ç」ように馴染みのない記号だったので、とりあえず例外として、わかりやすい順番で書いてきたつもりですが、「ン」は当の例外といっても過言ではないと思います。 「ん」の音は6種類もある!? まずは皆さんも経験から知っていると思いますが、「ン」を単体で発音しにくいということです。 もしあなたが悩んでいるときに、「んー」という音が出たとしても、実際に表記すると「うーん」となるのではないでしょうか。この単体で発音できないという特殊性を感じますね。 そして、これは次の特殊性と関わってくるのですが、みなさんは「ジ」のとき、摩擦音と破擦音の二つあり、そこで苦労した方もいると思います。同じ「ジ」な

    【日本語教育能力検定試験音声対策】撥音「ン」の発音をわかりやすく!
  • browser-useによるブラウザ操作自動化のサンプル集

    はじめに browser-use を使う上で詳しいドキュメントがなかったので、自分で使ってみたことをまとめてみました。 browser-use の基礎的なところは以下にまとめてあります。 ブラウザを起動させず、ヘッドレスモードで実行したい BrowserConfigのheadlessをTrueにすることで、ブラウザを起動させず、ヘッドレスモードで実行することができます。 from browser_use.browser.browser import Browser, BrowserConfig browser = Browser( config=BrowserConfig( headless=True, ) ) async def main(): model = ChatOpenAI(model='gpt-4o') agent = Agent( task='東京の天気をGoogleで調べて

    browser-useによるブラウザ操作自動化のサンプル集
  • 【2024年版】全SNSにオールマイティーなOGP画像サイズはこれだ!(X、Threads対応)

    これからOGPの設定方法に入る。一般的なOGPの設定は、通常HTMLの<head>~</head>内に以下のように記述する。 <meta property="og:title" content="音楽特化型デザインサービス double#" /> <meta property="og:type" content="website"/> <meta property="og:url" content="https://d-sharp.com" /> <meta property="og:image" content="https://d-sharp.com/fb_thum.jpg" /> <meta property="og:site_name" content="音楽専門デザイン・サービス│double#" /> <meta property="og:description" conten

    【2024年版】全SNSにオールマイティーなOGP画像サイズはこれだ!(X、Threads対応)
  • メモ管理は Obsidian in Cursor が最強|松濤Vimmer

    はじめまして。松濤Vimmerと申します。 普段はWeb系の会社でフロントエンドエンジニア、デザイナー、PMなどしております。 早速ですが筆者が投稿した以下のツイートが反響を得ました。 メモ管理は Obsidian in Cursor が最強。 Obsidianはmd ファイルとして一つ一つが独立して存在している。これらをcursor agent に読み込ませることでmcp みたいな運用ができる。具体的な運用方法は以下リプに載せる。 — 松濤Vimmer (@shotovim) December 16, 2024 投稿した当時はフォロワー10人ほどでしたが、元木さんをはじめ多くの方に拡散していただき8万インプレッションを超えることができました。 そこでお礼の意味をこめてこのツイートをもう少し詳しくまとめた記事を書きたく今回このような形で執筆させていただきました。 お願い 多くの方にリポスト

    メモ管理は Obsidian in Cursor が最強|松濤Vimmer
  • 「旧字体」は「昔の漢字の形」ではない

    こんにちは、鹿野です。 「国」に対する「國」、「沢」に対する「澤」などは旧字体と呼ばれています。「旧字体」という言葉自体を知らなくても、「昔は今とは違う漢字の書き方もあった」くらいはなんとなく知っているよ、という方は多いと思います。 ▲この記事ではKが旧字体、Sが新字体であるとき「K/S」と表すものとします しかし残念なことに、漢字が好きでも「旧字体」のことを雰囲気でしか理解しておらず、「古い漢字」程度にしか捉えていない人がほとんどです。そのため、以下のような勘違いをする人が非常に多くいます。 ▲よく見かけるが実は全部間違い これらの発言はなぜ間違いなのでしょうか? 目次 ◎意外と知らない「旧字体」の定義 ◎「旧字体」の定義における注意点 ◎誤解①:新字体は戦後日でまとめて作られた ◎誤解②:戦前日では専ら旧字体が使われていた ◎誤解③:新字体は旧字体を変化させてできた ◎旧字体と誤解

    「旧字体」は「昔の漢字の形」ではない
  • RAGは検索エンジンが命!Azure AI Search初心者入門 - Qiita

    はじめに こんにちは! AI エンジニアのヤマゾーです。 近年、生成 AI の進化が目覚ましく、生成 AI を活用したシステムの開発が盛んに行われています。その中で最も有名なテクニックが RAG です。RAG というのは検索拡張生成 (Retrieval Augmented Generation) の略で、質問の関連情報を検索し、質問と関連情報をセットで入力して回答させる技術のことです。 各企業ではこの RAG システムを積極的に導入していますが、ほぼ確実に課題になるのが検索部分の精度です。そして検索精度を上げるためには検索エンジンの知識が必要不可欠です。 記事では検索エンジンの筆頭サービスである Azure AI Search を題材に、検索エンジンの基的な仕組みや検索クエリの書き方について初学者向けに解説します。 サマリ 記事の目次 1. Azure AI Search の概要

    RAGは検索エンジンが命!Azure AI Search初心者入門 - Qiita
  • 多段 ssh するなら ProxyCommand じゃなくて ProxyJump を使おう

    概要 AWS とかで踏み台ホスト経由(ここでは AWS っぽく bastion と呼ぶ)で ssh する必要があるなら ~/.ssh/config は↓みたいにしとくのが良いんじゃないかな? Host bastion Hostname bastionのIPアドレス User bastionのユーザ名 # ↓は規定のファイルだったり ssh-agent 使ってれば不要 IdentityFile bastion接続用の秘密鍵ファイル名 # ↓の3つはWindowsでは使えないので諦めて ControlMaster auto ControlPath ~/.ssh/cp-%r@%h:%p ControlPersist 10m Host 好きな接続先名 Hostname 接続先のIPアドレス User 接続先のユーザ名 # ↓は規定のファイルだったり ssh-agent 使ってれば不要 Identi

    多段 ssh するなら ProxyCommand じゃなくて ProxyJump を使おう
  • [翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜

    この記事は "What We’ve Learned From A Year of Building with LLMs" という記事を著者の一人である Eugene Yan さんから許可を得て翻訳したものです。 https://applied-llms.org/ Thank you for giving me a permission to translate this wonderful article! 著者の方々 Eugene Yan Bryan Bischof Charles Frye Hamel Husain Jason Liu Shreya Shankar 原文の公開日 2024/6/8 今は大規模言語モデル(LLM)を使った開発がとってもエキサイティングな時期です。この1年間で、LLMは実世界のアプリケーションに対して「十分に良い」ものになりました。そして、年々良くなり、安く

    [翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜
  • VSCodeで生産性を上げる

    はじめに こんなツイートを見て執筆をしようと思いました。 実際に、VSCodeは機能の追加や拡張機能の開発が活発に行われており、かつUIもユーザーフレンドリーであるため人気のエディターだと思います。VSCodeを使いこなせるのとそうでないのではエンジニアリングの生産性に大きな差が出てしまうと思います。 パンくずの設定 '>' を入力します。 '>' preferences: Open User Settings (JSON)を入力します。 僕のsettings.jsonは以下です。 { "workbench.colorTheme": "GitHub Dark", "terminal.integrated.fontFamily": "MesloLGM Nerd Font", "terminal.integrated.profiles.osx": { "fish": { "path": "/o

    VSCodeで生産性を上げる
  • GitHub Actionsにおける脅威と対策まとめ

    はじめに こんにちは、サイボウズ24卒の@yuasaです。 サイボウズでは開発・運用系チームに所属する予定の新卒社員が研修の一環として、2週間を1タームとして3チームの体験に行きます。新卒社員の私が生産性向上チームの体験に行った際に、チーム内でGitHub Actionsを利用する際の脅威と対策について調査を行い、ドキュメント化した上で社内への共有を行いました。記事では、そのドキュメントの一部を公開します。 対象読者 記事の主な対象読者としては、以下のような方を想定しています。 GitHub Actionsを組織で利用しているが、特にセキュリティ対策を実施していない方 GitHub Actionsを組織で利用しており、部分的にセキュリティ対策を実施しているが、対策が十分かどうか分からない方 記事がGitHub Actionsのセキュリティ対策を検討する上で参考になれば幸いです。

    GitHub Actionsにおける脅威と対策まとめ
  • Googleの検索アルゴリズムの内部資料が漏洩か?「SEO業界で長年疑われていたものが明らかに」

    Mic King @iPullRank Ok, let's get this party started! A couple weeks ago I said I was publishing the most important thing I ever wrote. I was wrong. Documentation related to the Google Search algorithm leaked and I spent the weekend tearing it apart. ipullrank.com/google-algo-le… ✌🏾 2024-05-28 11:10:19 数週間前、私はこれまで書いた中で最も重要なものを発表すると言いました。それは間違いだった。 Google検索のアルゴリズムに関するドキュメントが漏洩したため、私は週末をかけてそれを徹底的に調

    Googleの検索アルゴリズムの内部資料が漏洩か?「SEO業界で長年疑われていたものが明らかに」
  • AI裏垢女子に気を付けろ(ディープフェイクで裏垢動画を作ってみた)|山野祐介

    私事ですが、骨折して2か月ほど半寝たきり&半引きこもり生活をしていました(動かな過ぎて痔になった)。なので連載以外は全く何もせず過ごしていたんですが、若干余裕が出てきたのでリハビリがてらnoteで好きなことを書きます で……久々にXを見て「おすすめ」タブに表示されていた裏垢女子を一度見たら、それからずっと出てくるようになってしまった。 裏垢女子というのは、一般的には性的な内容のポストや画像の投稿をあけすけに行い、会って性行為に及ぶのもやぶさかではない……みたいな女性ユーザーのことを指すが、体感では純粋に性的な出会いを求めている人は0.2%くらいではないかと思う。 残りの99.8%は ・「ここで連絡先交換してます♥」とか言われて詐欺の出会い系(会えることや資金譲渡をエサに入金を何度もせびられる)に誘導される ・DMで交通費やホテル代などの名目で「PayPayやAmazonギフト券をくれたら会

    AI裏垢女子に気を付けろ(ディープフェイクで裏垢動画を作ってみた)|山野祐介
  • メルカリで値段の「¥マーク」を小さくしたら購入率が伸びた理由、ペイディがサービス名を「カタカナ表記」にする理由など、プロダクトのマーケ施策まとめ30(2023)|アプリマーケティング研究所

    メルカリで値段の「¥マーク」を小さくしたら購入率が伸びた理由、ペイディがサービス名を「カタカナ表記」にする理由など、プロダクトのマーケ施策まとめ30(2023) 2023年に取材した記事から、長く参考になりそうな施策をまとめました。※ 数値等はあくまで取材当時のものです。 1、商品ページの「¥マーク」を小さくしたら購入率アップ(メルカリ)メルカリでは、商品詳細ページの「値段の¥マーク」を小さくしたところ、購入率が大きく上昇した。 理由としては、¥マークを小さくしたほうが、心理的な「価格の圧迫感」が減って、心理的にすこし安く感じるためと考えられている。例えば、¥マークが大きいと桁数が多く感じたり、価格を高めに感じやすい。 この案があがったときには、社内でも懐疑的だったそうだが、テストすると小さな開発コストで大きなリターンを得られる施策になった。 元記事:https://markelabo.c

    メルカリで値段の「¥マーク」を小さくしたら購入率が伸びた理由、ペイディがサービス名を「カタカナ表記」にする理由など、プロダクトのマーケ施策まとめ30(2023)|アプリマーケティング研究所