分析エントリー

【告知】ブレインパッド アドベントカレンダー2023がはじまりました!

12月1日よりブレインパッド毎年恒例のQiita アドベントカレンダーが始まります!当社のデータサイエンティストやエンジニアによる分析や開発の話が、今年も盛りだくさんです! こんにちは、広報です。クリスマスツリーやイルミネーションで街が明るくなり、…

ソフトウェアエンジニアリングにおけるLLMの適用に関する最新論文調査【技術動向調査】

ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、ソフトウェアエンジニアリングにおける作業の自動化と効率化に向けたLLM…

量子化とAttentionに関する最新論文調査 【技術動向調査】

ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、LLMの効率化・高速化をテーマとした論文を新たに3つ紹介します。目次 今…

LLMのハルシネーション制御や強化学習自動化等に関する技術調査 【技術動向調査】

ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、性能改善をテーマとした論文を新たに4つ紹介します。目次 今回のテーマ …

生成AIのマルチモーダリティに関する技術調査【技術動向調査】

ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、生成AI・基盤モデルのマルチモーダリティをテーマに4つの論文をご紹介し…

生成AI・LLMのツール拡張に関する論文の動向調査 2023年9月版

ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、第3回でも取り上げたツール拡張をテーマに、新たな論文を4つご紹介しま…

LLMの学習・推論の効率化・高速化に関する技術調査 【技術動向調査】

ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、LLMの学習・推論の高速化・効率化をテーマに3つの論文をご紹介します。…

生成AI・LLMのツール拡張に関する論文の動向調査 2023年8月版

ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。現在は、週に1回程度の頻度で、社内で実施している生成AI・LLMに関する論文レビ…

LLMの出力制御や新モデルについて【技術動向調査】

ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 現在は、週に1回程度の頻度で、社内で実施している生成AI・LLMに関する論文レビ…

ChatGPTに共通テスト解かせてみた

ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回はChatGPTに共通テストを解かせ、LLMの得手不得手を検証してみたことを、ご…

LLMの推論を効率化する量子化技術調査 【技術動向調査】

ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 本記事から週に1回程度の頻度で、社内で実施している生成AI・LLMに関する論文レ…

介入タイミングが複数あるときの差分の差分法:Staggered DiDの紹介

当社のデータサイエンティストによるテックブログです。今回は、DiD(差分の差分法)を取り上げます。DiDは、因果推論の書籍では必ずと言っていいほど紹介される古典的な手法でありつつ、学術的にここ数年で盛り上がっているトピックでもあります。本ブログ…

ブレインパッド社員が投稿したQiita記事まとめ(2023年2月~6月、OpenAI、ChatGPT、LangChainほか)

2018年1月から開始しているブレインパッドQiita Organizationの中から、社員が投稿した記事を「Qiita記事まとめ」として紹介する本ブログ。今回は、2023年2月~6月の記事をご紹介します!

LLM研究プロジェクト ブログ記事一覧

ブレインパッドでは、LLM研究プロジェクトの活動の一環として、技術やビジネス実装に関するブログ記事の執筆を積極的に行っています。これまでに執筆されたブログ記事は約40本となり、SNSなどでの注目度も大変高くなっています。本ブログ記事では、これまで…

ChatGPT APIで社内データについて回答するSlack BotとWebアプリを作った

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 5月16日から毎日更新を続けてきたLLM特集も、本ブログで第1弾が一区切…

OpenCALM-7Bにファインチューニングを実施してポジネガ分析に関して賢くなるかを確認してみた

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回、日本語LLMである「OpenCALM-7B」と日本語データセット「JGLUE」…

日本語データセットを用いたMPT-7Bのファインチューニングおよび性能評価とチャットボット構築

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 最近、オープンソースかつ商用利用可能なLLMを日本語に対応させるファ…

生成AIは人類のcopilotたりうるか——LLM/Generative AIの可能性と諸問題の考察

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、「copilotとしての生成AI」という視点で概況を捉え、LLM…

強化学習による在庫最適化問題へのアプローチ

今回は、近年注目を集めている強化学習を用いた「サプライチェーン全体の在庫管理最適化」に応用します。在庫管理の簡単なモデルケースを置いて、強化学習による在庫管理最適化がどんな強みや特徴を持っているのか、図を用いながら説明します。 こんにちは。…

RLHFを利用して用途に応じたLLMを生成できるツールの紹介

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、ChatGPTなどで好ましい応答を得られるように、人間からAIモデ…

Auto-GPTを使って2値分類タスクを解いてみた

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、自律型AIエージェントに実際人間が解くような比較的複雑なタス…

【連載②】生成AIのマルチモーダルモデルでできること -画像生成+ファインチューニング編-

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、生成AIの中でも、テキスト、画像、動画、3Dデータ、オー…

大規模自然言語モデル(LLM)をお試し利用できるツールを作ってみた

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、さまざまなLLMにどういった特徴や違いがあるのかを検証するた…

自律型AIエージェントのご紹介

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、自律型AIエージェントの機能や動作についての説明とあわせて、…

Google が提供するLLMサービスとPaLM2のFine-Tuningについて

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、Google から提供されているLLMやGenerative AIサービスのうち…

新旧言語モデルの比較:LLMと伝統的なアプローチのメリットとデメリット

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、LLMの流行が起きている今だからこそ、改めてLLM以前の代表的な…

ChatGPT APIで「素人質問で恐縮ですが…」と鋭い質問してくるSlack Botを作った

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、議論を活性化する質問をLLM技術によって生成できないかと考え…

RWKV(Receptance Weighted Key Value)をつかってみた

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、Google Colaboratory を使って、チャットAI「ChatRWKV」…

プロンプトエンジニアリング手法 外部データ接続・RAG編

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、Retrieval Augmented Generationを使用して、ユーザーか…

ChatGPTとLangChainを活用してデータ分析アプリを作ってみた

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、ChatGPTとLLMを使って、プログラミングの知識なしでデー…

LLMにガードレールを適用してビジネスリスクを抑制する

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、LLMを制御する方法のうちNVIDIAが開発しているOSSライブラリー…

継続的デリバリーにおける負荷テストの実施内容を紹介します

データ活用をシステム面から支援するデータエンジニアリング本部(通称:DE本部)の社員がお送りする技術ブログです。今回は、継続的デリバリーにおいて重要な負荷テストについて、短期間での簡易的な性能試験(スモークテスト)で得られた知見をご紹介しま…

LLMを制御するには何をするべきか?

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、LLMを制御するためのアプローチについてご紹介します。 問題意…

Fine-tuningタスクでPyTorch 2.0の効果を確認する

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、2023年3月に発表されたPyTorch 2.0のcompileを試し、速…

【連載①】生成AIのマルチモーダルモデルでできること -タスク紹介編-

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、生成AIの中でも、テキスト、画像、動画、3Dデータ、オー…

GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、GPT-4の登場から執筆日(2023年5月31日時点)までの2ヶ…

ChatGPTのAPIを使って、学習用ドキュメント生成ツール作ってみた

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回、プログラミングなどのIT技術系のトピックについて、LLMに学習用…

ざっくりわかるRLHF(人間からのフィードバックを用いた強化学習)

概要

BERTとChat GPTの精度を比較してみた②

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 BERTとChat GPTの精度比較に関する記事を全2回でお届けします。連載の…

BERTとChat GPTの精度を比較してみた①

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 BERTとChat GPTの精度比較に関する記事を全2回でお届けします。連載の…

LLM推論にGPUは1つでいい?FlexGenについてまとめてみた

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、LLMをお手元のPCで扱ってみたい方々に知っていただきたい、202…

ChatGPTを支える技術 コンテンツモデレーションの紹介

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、論文をもとにChatGPTでコンテンツモデレーションモデルがどの…

AzureOpenAIのネットワークセキュリティをどうするか

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、ビジネス展開を想定したAzure OpenAI Serviceのネットワークセ…

GCPで動かしたTabbyをローカルPCで使ってみた

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、新しいコードサジェストツール「TabbyML/Tabby」についてご紹…

【連載④】大規模言語モデル(LLM)のビジネス利用に関して注意すべき点-海外の法規制-

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。LLMのビジネス利用に関する注意点を扱う連載の最後となる今回は、「海外…

【連載③】大規模言語モデル(LLM)のビジネス利用に関して注意すべき点-著作権の侵害リスク-

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、LLMのビジネス利用に関して注意すべき点として、「著作権の侵害…

LLMを効率的に再学習する手法(PEFT)を解説

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、効率的にLLMのような事前学習済みモデルを再学習する手法(PEFT)…

Azure OpenAI ServiceについてAzurePortalでできることまとめ

AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、前回に続きAzure OpenAI Serviceについて取り上げ、Azure Portalにはどのようなメニューがあり、何ができる…

Azure OpenAI ServiceでChatGPTを使ってみた

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、新登場したAzure OpenAI ServiceでChatGPTを使うまでの流れを…

【連載②】大規模言語モデル(LLM)のビジネス利用に関して注意すべき点-個人情報や営業秘密等の保護-

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、LLMのビジネス利用に関して注意すべき点の中でも「個人情報や営…