>>1639152 в общем, квен4б за 18 секунд превратил этот промпт: >a young woman in dolphin shorts riding a pony in 90s aethetic residential street of a russian town. very real looking photo with high definition and detailed skin. в следующий промпт: >A young woman with natural, sun-kissed skin and casual, slightly tousled hair rides a sleek, chestnut-colored pony along a quiet residential street in a Russian town evoking 90s nostalgia — brick houses with faded paint, overgrown lawns, and vintage cars parked along the curb under soft golden-hour light; she wears form-fitting dolphin shorts in a muted teal or olive tone, her posture relaxed yet confident as she holds the reins, the pony’s mane catching the breeze; the scene is rendered as a very real-looking photograph with high-definition clarity, ultra-detailed textures on skin, fabric, and surroundings, shallow depth of field blurring background elements while keeping foreground sharp, capturing the candid, warm, slightly gritty aesthetic of 90s suburban life — no added characters, animals, or props beyond what’s described.
сама генерация заняла 22 секунды (без учета того, что 4б квен переписывал мой промпт).
титьки я не просил, лол
вторая генерация 2k картинки заняла 1 минуту на RTX 3070.
сид другой но результаты тот же самый - привет от ZITки.
>>1639226 Это не блюр, а реальные закон оптики. Погугли числа диафрагмы. Чем больше f/N тем резче будет задник. Но у тебя на скринах и так почти f/16. Воспринимает ли модель что то типа f/32 и понимает ли в принципе - неизвестно. А без этой глубины резкости фотка будет выглядеть реалистично
Что бы размыть фон люто надо f/1.4 -f/1.8 при обычных 50mm.
Еще не хватает понимание моделей среднего формата. Заебало 35мм.
>>1639156 всмысле мода, у тебя буквально каждая модель с той или иной цензурой, просто прогресс дошел до фильтров, решение так то лучше чем вырезать из модели все что может сойти за опасный контент, нельзя натренировать модель на анатомию без голых людей, учебники по биологии никто ж не банит... клейну вон аж анатомию сломали цензурой, когда модель не знает анатомию, потому что все вырезали нахуй чтоб не дай бог сисик не показало где нибудь, а как тогда модель тебе будет показывать позы людей хуй его знает, поэтому даже всякие файтюны лоры и прочая залупа не чинит его анатомию (но делает лучше конеш) так как проблема глубоко в кишках. (всякие аниме хуйни тренированные на бурах не в счет) так что пусть лучше фильтры хуячат, чем вообще из датасета уберают
у креи кстати интересный видать датасет был, модель даже анальный кекс генерит из коробки
>>1639226 поюзал и бросил, буквально блюр, беднота и какой то реализм уровня говномержа с цивита, да и идиотграм разбаловал управлением
Что-то идеограм кал какой-то. Где-то в 40% случаев полностью игнорирует промпт и генерит рандомную хуйню, в 60% - >>1639302 вот это говно. Промпты абсолютно безопасные.
да и у креи такая бяда как и у флюкса, ебаная блестящая резина вместо кожи, а еще походу в дата сете дохуя веснушчатых, постояно срет ими в генах, ну еще при зуме видна нейрохуйня типо принта, точки ебаные
у идиотграма гены как то максимально лишены этих болячек, более приближено к реальным фотках и естественному ухудшению качества при зуме, тип даже если приблизить генчик с идиотграма под лупой, таких явных нейрослопских болячек там не увидишь
Скуфджоли не даст соврать (бля ну могли бы датасет на старых актрис брать с их золотых времен бля, от Бритни Спирс даже грустно как то...)
Тут вышел бигасп 3 под клейн. Пока версия без RL и дистилла, так что ейлер 20-40 шагов, кфг побольше и негатив хороший. Чуть растерял способности к редактированию, в остальном очень неплох.
>>1639363 Промпта не слушается, качество сомнительное, две трети генов законтачены сейфти. Не ощущаю восторга.
>>1639373 Накатывать порнолоры, чтобы обойти фильтр на безопасных промптах? Охуенный план. У меня каждый пик в порево превратится, я это уже проходил на какой-то старой модели с годик назад. Жсон промптинг пробовал, до пизды. План состоял в подготовке пиков для генерации 3д, так что нужна модель, которая слушается промпта, генерит не совсем говно и может в разнообразие. Пока что ближе всех к этому приблизился ZIT, но он не может в разнообразие и на 20 промптах генерит один пик.
>>1639408 тебя забанили в поисковиках чтоли, или ты спецом набрасываешь, если ты самостоятельно не можешь ничего найти, то у меня для тебя плохие новости
а так лучше уж пусть цензурный фильтр накатывают который мы потом обходить будем, чем режут датасет и ломают мозги модели
а под безопасный промпт это ты так думаешь, буржуи вон вообще по каждой хуйне ущемляются, и фильтр вылетает не только когда есть опасный контент но и в других определенных случаях
ну так разберись в вопросе, попробуй у себя, там у кого работает, у кого нет, мы же не знаем что они там промптят что им банят, я вообще почти не вижу эту хуйню.
у меня сафети фильт на тренировки лоры в семпле разок вылетал, при чем только на одной эпохе вот и думай с чем связана хуита эта
но я проблемы в этом не вижу, тебе никто не даст порномодель без лимитов, с говном съедят потом за такие шалости (имею ввиду нацеленных на корпоративный сегмент) и как сказал лучше так, чем резать мозги модели.
>>1639408 >Промпта не слушается Это очень жирный наброс, либо ты даун, у которого промт из 10 тегов от полторашки. Вот тебе пруф. Первый пик описан LLM, второй - поправленный руками текстовый промт убрал трусы и сделал фото, без боксов и JSON.
>>1639461 Раньше эксперименты с LLM были прикольные, ты нащупывал какие-то пограничные стили, цвета, композицию, что может модель, что не может. С выходом идеограма ноль интереса, тупо перерисовывает исходник
>>1639469 gemma4 31b. Надо бы 12b попробовать, там говорят вижн фичи подтянули, но руки не доходят Справедливости ради, остаются неудачные примеры. Но они именно что неудачные, а не какие-то принципиально другие.
>>1639430 Хуй знает, по-моему это один из самых неудачных релизов. У меня буквально со всеми описанными обходными путями не меньше половины отказов на безопасных промптах; и json, и LLM, и сигмы - до пизды. Но хуже всего игнор промпта, конечно. Сгенерить батч из восьми, удалить половину потому что цензура, а потом понять, что оставшиеся два совсем не то, что ты хотел. Охуенный пайплайн. >>1639433 Я бы сказал, что гейткипить это по-пидорски, но с такой моделью не страшно. >>1639443 Ну нихуя себе достижение - жопу сгенерировал. Пиздец. Пожалуй, почти уровень SDXL.
Krea2. Погенерил некоторые свои старые промты, которые пережили все модели. Поэтому помню сколько мучений и реролов надо было сделать, чтобы устранить лишние пальцы, ноги и т.п. Так вот на Креа я ни разу не видел таких косяков. Она сразу генерирует нормально. Пусть не хватает реалистичных текстур, но с геометрией там точно хорошо. Лоры запилят на реализм и будет шикарно. У нее лицензия лояльная и за неё точно возьмутся.
>>1639482 Попробуй qwen3vl_8b_fp8_scaled от идеограма, интересно сравнить с монстром 31b. После нескольких дней ебатни с гуфами на gemma 12b - на нее перешел. Надо будет попозже с qwen3.5 из комфи сравнить, нейронка пишет, что qwen3.5 лучше. А вот gemma4_e4b, которая в рекомендациях разрабов - просто кал говна. И тут наебали.
>>1639491 >нихуя себе достижение Ты спизданул, что модель не слушается промта. Твое зеленое рыло обоссали с пруфами, что промт практически один в один копирует картинку. Продолжаешь хрюкать)))
>>1639491 >по-моему это один из самых неудачных релизов Ну я бы сказал это один из лучших релизов, по качеству и управлению подобной хуйни в попен сорсе мы не получали.
у кляйна и флюкса вот да худший релиз, когда один тяжелый как хуй знает что, а нормальную мелкую эдит модель сломали цензурой и до сих пор энтузиасты не могут вылечить анатомию
у идиотграма хоть другим путем пошли и то хорошо.
Тут в целом то вопрос цензуры не должен стоять так то. Я удивляюсь комментариям соевиков с средита что им цензурный фильтр прикрутили, и прочая хуита.
Как дети бля. Мы ж взрослые люди епт, и должны понимать что такая хуйня это норма. Никаких нормальных вариаций моделей без ограничителей не будет. Как будто бугурт с визой/мастеркартом в другой реальности был. Ну и если ты серьезный дядя и тебе нужны инвестиции, писиков не будет. (ну будут но за тысячей фильтров и забаненых слов) а в текущей так сказать ситуации на рынках, я бы сказал если бы порнохаб выпустил бы свою модель, там бы тоже порно не было, ток легкая эротика (и то не факт) :D
А там почему то мнение раз веса вывалили, то они должны быть без трусов сразу
>>1639511 >А там почему то мнение раз веса вывалили, то они должны быть без трусов сразу Я ещё раз говорю - я не пробовал NSFW промпты. Вообще. Архитектура, фурнитура, ёбаный пришелец. На всё триггерится цензура. Такая хуйня это не норма и близко, это релиз уровня SD3.
>>1639517 эта пикча вылезает только если у тебя промпт ультракороткое дерьмо. используй ноду ideogram prompt builder из дефолтного воркфлоу, там и одного bboxа даже будет достаточно.
>>1639480 > затея перерисовывать не интересная Во времена t5 она была очень даже интересная. Один в один исходник никогда не получался. По сути исходная картинка была лишь частью референса, всегда был эксперимент
>>1639513 > Задача при помощи text2image генерации создать изображение максимально близкое к исходнику. Подумай в чём главный фокус изображения, что притягивает интерес зрителя. Будь внимателен к персонажам, предметам, деталям, стилистике, технике, перспективе, ракурсу, композиции, освещению, текстурам и артефактам. > Как писать промпт описано в @IDEOGRAM.md . Промт должен быть структурированным вложенным подробным json большого объёма, с несколькими bbox описывающими структуру, текстовые поля должны содержать развёрнутое описание. Для избегания ложных перекосов в изображении не забывай добавлять описания побочных визуальных деталей таких как книга на столе или часы на стене
Там не гейткипинг, а коупинг. И 1girl с кумерством в терминальной стадии в анамнезе. Ideogram 4.0 как инструмент подходит для его случая лучше остальных. Объективно, эта модель такие примитивные сцены рисует довольно неплохо. Как только начинаешь строить сложную сцену со смешением стилей, даже с bounding box, начинаются фокусы с освещением, а общий стиль сваливается к digital painting, и победить это непросто. Лучше даже не соваться, а сцену делать наиболее простой и без смешения стилей.
С текстурами там всё в порядке, как я вижу. Это просто нечестный приём времён Qwen-Image для придания иллюзии детализированности (или особенности модели, я не знаю точно): dithering halftone pattern. Попробуй прогнать результат через i2i refine с двукратным апскейлом и должно стать лучше. На Qwen-Image для этого был специальный фикс с 2xVAE. Здесь можно сделать любым апскейлером типа SeedVR2, просто, чтобы поломать этот «узор». Визуальная чёткость от этого не вырастет, но dithering halftone pattern должен пропасть.
>с геометрией там точно хорошо Явно лучше, чем у Ideogram 4.0, который, похоже, в принципе неспособен не корёжить мелкие высокочастотные детали изображения, сколько с настройками ни бейся и sigmas, mu, std ни крути. На органике это не сильно бросается в глаза. Как только идёт техника, механика или архитектура, вылезает во всей красе, устанешь рефайнить.
>>1639495>>1639493 Скручивать квен неохота. Я раньше активно использовал использовал qwen3-vl:30b он moe и достаточно хорошо описывал в том числе обнажёнку. А сейчас у меня гемма закрывает все вопросы и по i2t, и по prompt enhance, и по ведению заметок, и по программированию
> какой квант у gemma4 31b норм? На фоне официального qat-q4 все остальные - плохо
>>1639560 >prompt enhance, ведение заметок, программирование Ясн. Ты используешь какие-то нахуеверченные воркфлоу или на стандартных все прекрасно работает? Или у тебя LLM вообще отдельно от комфи?
>>1639582 >LLM вообще отдельно от комфи? Это. Все манипуляции в агентах и питонах делаются наруже, рожают текстовый файл. Комфи только преобразует текст в картинку. Ибо я заебался с этой лапшой.
эх как же хочется вместо обычного вае пидом полминуты декодить уже готовую картинку без видимых отличий, зато пид это молодёжно и свежо ммммм поду запихну его во всё что можно
>>1639549 Мне и нужны были примитивные сцены. Без освещения, без композиции, дополнительных объектов, фона и так далее. Каждый пик - отдельный объект, плюс генерация картинка-в-картинку. Следование промпту, возможность генерации разных стилей. Больше нихуя не требовалось. Ни реалистичная кожа, ни микропух на заднице, вообще ничего. Как оказалось, найти модель, которая это умеет - достаточно непросто.
>>1639549 та ну ты гонишь, креа2 буквально говномерж с цивита. (и то я бы сказал говномержи есть и получше)
пластиковые текстурки и нейрослопный принт с артефактами разной всратости и любит накидать веснушек. править это через сидвр чтоб лицезреть эффект змеиной чешуи, ну хуй знает. та там даже трава говна хуль говорить то тот же вангирл отвратительный у неё
единственный плюс модели таки это хорошее знание нсфв из коробки и селебы, что упростит ананасам с цивита прикрутку порно лор.
>>1639545 > А сейчас у меня гемма закрывает все вопросы и по i2t, А в сравнении с бесплатными, например gemini 3.5 flash на каком уровне gemma4 31b? И еще под каждый запрос получается память загружает LLM например ollama, потом выгружает, потом загружает уже модели вф комфи или как? Это много времени занимает и на 16@32gb вообще будет адекватно работать?
Мне гемини пытается втюхать Qwen2.5-VL-7B и еще какие то неизвестные мне модели, при этом Gemma 4 вообще в её списке нет, как вообще понять какой варик для энханса и reference промтинга самый лучший, не говоря уже про нецензуренную версию?
>>1639419 всё, всё, всё, поезд ушёл, идиотограмм ненужон, есть креа, все на крею!!!1111 >>1639433 >залётных а тут ведь только одни 40 летние суровые профессионалы) >>1639492 >Она сразу генерирует нормально без лор на ванильных моделях и так всё ок. >>1639507 >кетчуп слава дарвину, минус 1 гуро-психопад. >>1639514 >криворукое хуйло пикрил...
Не, ну ожидать ёба качества кожи-хуежи от турбо версии это надо быть сверхразумом. Та же зетка турбо, которую никто из адекватных людей нахуй не использует, в 10 раз хуже. Проблема в том, что пока не понятно есть ли возможность накатить турбо лору на 0.5 силе на базовую модель, там они как-то отличаются сильно.
>>1639645 > ёба качества кожи-хуежи от турбо версии Жду от тебя сабжа из под ванильной базовой версии, но что-то мне подсказывает, что дождаться молока из под козла у меня больше шансов. Не правда ли, пиздабол-пиздаболыч?
>>1639614 gemma4 12b и 31b, для твоего конфига только на квантах, но ты поебешься прикрутить это все на комфи. Попробуй qwen3.5 из темплейтов комфи или qwen3vl_8b_fp8_scaled из текстэнкодера идеограм. Про gemma4_e4b вообще забудь.
>>1639614 Для i2t реально промт решает. Объективно для задачи ревес промптинга всё сносно работало и год назад. Порой vision модель не замечала ракурс, или там национальность пероснажа, или эмоцию на лице, ещё какую-то важную мелочь. Добавляешь в запрос нужное уточнение - и магия запускается. В идеале конечно запрос тюнить под разные домены
> Это много времени занимает Это занимает дохуя времени потому что ещё и свопается. Потому я генерю пачку промптов, обычно 8 шутк, переключаю модель и генерю пачку из 16 картинок
>>1639659 детальность кожи возможна только на очень коротком фокусе, если помнишь мои заёбы с натюрмортами, у модели нет силёнок задеталить всё поле (не хватает кфг), только небольшой локальный участок. впрочем на сдохле без лор было почти тоже самое.
там какой то соевик с средита подтвердил это, сказав что ситуация на базе еще хуже чем на турбе и она по сути (в текущем виде) не пригодна для гена
я так то не тебователен и у креи есть свои плюсы как говорил в виде хороших знаний в нсфв с селебами (анальный кекс из коробки епт) для фана, но эта ебаная картинка после идиотграма не радует глаз вот D:
Вероятно случайно, но на 3.5 flash зацепило абсолют синему. Гемму 4 после этого юзать не очень хочется, но посмотрим. ИДЕОГРАМ4 МОЖЕТ ГЕНЕРИТЬ КИНО УРОВНЯ GPT2!!!!!! Проблема только как это цеплять промтом и вф Свечи и вино хуево получилось, но ебало и освещение - просто это просто имба. Причем на стандартном ВФ такой картинки не получается. Ниже сравню 2 варианта паутины которую сам нихуя не понимаю
>>1639679 > 3. перешарп. Для скриншота из блюрея да, и контраста многовато. В остальном охуительно. Ничего реалистичней киношного от локалок я не видел еще. Видимо, у идеограма есть GoT датасет, и если он благополучно подтягивается - то это как строенная лора GoT генерит похожие кадры из фильмов. То есть не универсальная хуйня, а жаль.
>>1639619 промпт был изначальный незаэнхансенный отсюда >>1639187 >a young woman in dolphin shorts riding a pony in 90s aethetic residential street of a russian town. very real looking photo with high definition and detailed skin.
>>1639704 >a pony in 90s aethetic residential street of a russian town ясень пень, что пони в рашн таун должны быть исключительно пржевальской породы, только есть нюансик, это дикая хуйня была абсолютно неприручаема и вымерла в середине прошлого века.
>>1639716 ахах, ни один из них не 16:9 причём. у флюса длиннее чем надо, у комфидауна тоже но чуть менее удлиненная, вообще чтобы чётко 16:9 было надо из второго пика выбирать разрешения
Промт одинаковый. Дефолтный ВФ из комфи выдает парашу в сравнении со вторым вариантом. На случайную погрешность сида/разрешения и даже CFG это не тянет - слишком большая разница в освещении и текстурах.
>>1639734 сид 132324943319318 { "high_level_description": "A cinematic, realistic movie still of Tyrion Lannister sitting in a dimly lit medieval stone chamber, holding a goblet of wine with a pensive expression.", "style_description": { "aesthetics": "gritty, historical fantasy, cinematic, moody, high-detail, dramatic", "lighting": "chiaroscuro lighting, warm candlelight casting deep shadows and highlighting facial textures", "photo": "35mm film, anamorphic lens, shallow depth of field, subtle film grain", "medium": "photograph", "color_palette": ["#1A0C00", "#4A2711", "#8B5A2B", "#D4AF37", "#3C3F41", "#1C1C1C"] }, "compositional_deconstruction": { "background": "A dark, atmospheric medieval stone chamber with rough-hewn stone walls, a faint tapestry hanging in the soft-focus background, and the warm glow of candlelight flickering.", "elements": [ { "type": "obj", "bbox": [250, 320, 900, 750], "desc": "Tyrion Lannister with features resembling Peter Dinklage, showing a thoughtful and slightly cynical expression. He has messy, short golden-blonde hair, a short beard, and a visible scar running down his face. He is wearing a detailed, weathered leather doublet with dark red fabric panels and subtle gold embroidery.", "color_palette": ["#D4AF37", "#4A2711", "#8B5A2B", "#F5D0A9"] }, { "type": "obj", "bbox": [720, 520, 880, 640], "desc": "An ornate, tarnished silver goblet filled with dark red wine, held firmly in Tyrion's hand.", "color_palette": ["#C0C0C0", "#58111A"] }, { "type": "obj", "bbox": [780, 100, 1000, 900], "desc": "A heavy, rustic dark oak wooden table with visible grain, scratches, and wax drips.", "color_palette": ["#2B1A08", "#4A2711"] }, { "type": "obj", "bbox": [450, 150, 750, 280], "desc": "A thick, melting beeswax candle on a simple iron stand, its flame flickering and casting a warm, golden light across the scene.", "color_palette": ["#FFCC00", "#D2B48C", "#1C1C1C"] } ] } }
>>1639734 через часика 2 ток наверн как лора дотрениться, но все еще глубоко убежден что с отрубанием негатива от ноды становиться лучше, модель начинает работать на других принципах, даже мой кастомный режим дефолта перестает работать
как минимум модель не ругается на отключение негатива от ноды, в отличие от других моделей например где этот шнурок обязателен даже с зероконд, а значит все прально и реализация негатива там задумана по другому (через саму унконд модель)
>>1639734 >>1639743 дополню себя что я ауру не подключал к унконд и генерю без негативов, хуй знает нужна ли вообще аура на унконд, это же считай минус модели, может вообще аура и там и тут нейтрализуют друг друга xD с лорами это ж так работает лора в модели дает сухой превалирующий плюс, который ты весами лоры в унконд балансишь
>>1639751 не думаю, у моделей четко есть же что им прям нужно для работы, отключаешь шнурок негативов от флюкса, он ноет что ему это надо, отключаешь у идиотграма, ему похуй, значит ненужон, и в работе изначально не предусмотрен, то что подрубить можно, так это ко всему так любую хуйню можно подрубить куда угодно
>>1639743 >>1639748 Аура на анконд вроде не влияет на одном сиде. Я подключил буквально сегодня т.к. во втором ВФ так было, что бы сразу отсечь.
Остальные рассуждения понятны, но они остаются рассуждениями. Без явных показательных результатов рассуждения не имеют смысла. В конечном итоге всем важна картинка. Я тестил отрубание анконд - не увидел. >>1638296 →>>1638332 → Разница - высосана из пальца с уклоном на ухудшение. Это точно не меняет качество текстур, артефактов, не меняет освещения. А вот управление сигмами судя по сравнению двух ВФ может влиять значительно.
Надо потестить Ideogram DualModelGuider + BasicScheduler. Они на 48 степах не срут качество вроде как. Вероятно хуета от комфи работает совершенно не правильно и сигмы там неправильные как ты там эти mu std не крути. Просто так случайно кино вряд ли бы получилось. Дауны из комфи могли даже просто мат. формулы некорректно насрать. По кривой сигма там видно какая разница большая, на выходе картинка отличная при этом.
>>1639734 Спасибо за ноду, интересно получается. Появилось ли качество на 48 шагов? Там еще есть пресеты в Markdown Note. Какой лучше? Очень долго тестить самому, может есть инфа?
Как так можно быть. В этой ноде забит промт фиксированный. Если тяну prompt>clip от неё - результат стабильно один.
Если открепляю prompt. Копирую JSON который выходит из этой ноды и вставляю напрямую в CLIP - результат меняется. Реверчу всё - откатывается. Как так сука
>>1639813 > Появилось ли качество на 48 шагов? В этой сцене не видно проблем на 24ех шагах, возможно из за общего стиля изображения и малой глубины резкости. Важно что я не увидел никакого ухудшения на 48 степах. пик1: 24 пик2: 48 Артефактов не появляется, зерно шума остается таким же на одном сиде. Либо я в глаза долблюсь. Возможно количество степов влияет положительно на более сложные и наполненные сцены, а здесь они не нужны.
Из за того что ракурс меняется, реализм освещения немного проебывается, но это и на 24степах есть на других сидах. На стандартном же ВФ от блядей комфи - 48 степ выдавал обосранную искажениями картинку. Я пока что зациклился дрочу на карлика и другие промты не тестил.
тренируем ассмусс, правда датасет говна но я хуй забил нормальный собирать, протегал в жесон по совести (нет все квен делал я ток кнопку жал), и в превьюхах я ббоксами обьебался походу (размерами)....
2000 шагов, но учитвывая что треню на 5e-5 свитспот будет наверно на 2.3 если не заруинится D: иногда думаю что идиотграм генит на тренинге семплы лучше чем некоторые модели в принципе генят
полная разверстка идиотграма для тренинга занимает дет 50+гигов
>>1639823 Текст портится часто. Добавь ватермарку в угол: Burned-in timestamp in the bottom corner reads 'Ideogram 25.06.2026'. Часто она битая получается.
>>1639841 БС, оптимайзер, шедулер, таймстеп тайп, декай? Ну или весь конфиг если не жалко. Для друга прошу )) У меня вроде пока около 2250-3500 получается опт в зависимости от датасетов. лр 1е-4, декай пробую повышать понемногу сейчас, косин, адам8, линеар или сигмоид, бс3
>>1639844 Просто выставляя 48 шагов. Мне похуй что в вф от комфи этот профиль менял параметры и влиял на сигмы, абсолютно похуй потому что это работало некорректно и срало. Если 48 шагов хотя бы не срут в качество - это уже прогресс.
>>1639851 от 48 шагов или от альтернативных гайдера и скедьюлера?
>>1639872 Но, по качеству она чуть лучше анимы реалистик тюнов а размер в несколько раз больше и скорость в несколько раз меньше, так стоит оно того непонятно...
>>1639887 проблема анимы в том, что там сыпется все кроме самой вангёрл, сложные задники не вывозит, либо каша либо мыло. все-таки моделька миниатюрная.
>>1639903 дело не в миниатюрности даже, на данбоору/гелбоору 1) в 80% задников просто нет 2) анимешные задники по сути абстрактные неровные пятна 3) никто их не тегал и модели не к чему прибиться если натренишь лору на архитектуру или мощно разбавишь датасет для модели то наверное всё получится, но на цивитах только порно при чем понисинтетика
бля ток сча заметил что обьебался и не поставил в тегах датасета жсон, тхт стояло... бля ну лан... у сука хуйня говна, поставлю потом на ретрен думал какое то совсем говно тогда получится, а вроде ничего даже, может он таки сожрал мои джесоны...
ктото там просил показать как идиотграм жрет детали на тренинге, вот показываю результат, более менее узнаваемого персонажа, сравните сами короч (хоть и накосячил при тренинге)
>>1639862 та стандартно, я там особо ничего не крутил особо, пошел по базе общей для тренинга
А косин не ставишь потому что больше конст нравится или просто так привык? Я прост со времен 1.5 не перевариваю постоянный лр - мне с ним лоры кажутся более грубыми, резкими, дубовыми. Лучше вначале лр побольше дать, а потом полирнуть меньшим на схождении. Ну опять же по опыту и ощущениям.
>>1639851 > Burned-in timestamp in the bottom corner reads 'Ideogram 25.06.2026' Хз почему, но именно этот текст стабильно урезается. С другим текстом проблем нет. Иногда ошибки - но у идеограма они вроде бы намного реже, чем проблемы с руками у клейна. 24 степа gentle юзаю
>>1639925 да там всё кривое сливающееся и тд, пока смотришь на персонажа всё норм, как только переводишь взгляд то пиздец, узоры сливаются, кривые очертания в кашу, окна пляшут, дома пляшут, трава всякая вообще просто шум непонятный
>>1639917 неправильно выразился, люди которые тренят модель дальше используют свои датасеты состоящие из селфи баб и не уделяют никакого внимания окружению
>>1639930 >датасеты состоящие из селфи баб Вот это прям вообще спидорак. Пытаешь девку в инетерсную позу поставить, а она всегда в одну встает. Потому что датасетом с какого-нибудь imagefap модель настолько лоботомировали, что кроме модель забыла нафиг вообще все, кроме самых простых поз и белых обоев.
Решил лично почувствовать ту самую разницу между дефолтом и отключенным негативом. И вот на 1girl и арфистке это было не так заметно, зато космос заиграл абсолютно новыми красками + исправилась геометрия истребителя. Это однозначно лайк, спасибо тому кто это раскопал.
>>1639937 Первая да, мне нравится, вторая более генеративная вoсковая фигура. До совсем уж скриншота чуть чуть не хватает чего то, но лучше чем всё что есть, даже гoпыч тут может сocнуть через раз. Генерилось бы всё с таким уровнем освещения, идеограм дотянулся бы до гoпы или даже превзошел по реализму в не супер масштабных сценах.
Ты первую на каком вф делал? У ноды есть readme.md, надо тестить параметры. Gentle пока самый лучший пресет. И в других промптах, сценах вероятно хуже будет.
Там написано что если выставить определенные параметры, то это должно работать идентично с dualmodel CFG
>>1639937 Это всё естественное хорошо получается. Добавь ему клавиатуру(чёткий геометрический объект) и увидишь как на ней кнопки мнутся, плавятся с этой нодой. Хорошо, если можно настройками исправить что-то, но при такой скорости генерации это не реально подобрать.
Лучше чем вангёл оказалось в кляйне ван сайфай билдинг, тупо с одним промптом нажимаешь жнеререйт и рассматриваешь чудо нейрослопной мысли, таймкиллер пиздец залипательный. А главное за наносек
>>1639987 Попробуй вот этот промпт с нодой и без: Digital photography, close-up shot, direct flash lighting creating strong specular highlights and reflections, slightly grainy texture, sharp foreground focus with blurred background, amateur photo, full body shot, soft film grain, subtle lens flare. Soft black volumetric lighting with warm sunset glow filtering through half-closed blinds, creating cinematic depth and intimate atmosphere. face, detailed long blonde hair with soft bangs framing face, pale flawless skin, petite fit physique, small perky breasts, thick black rimmed glasses, gentle shy smile, glossy lips, light freckles across nose and cheeks, subtle blushing cheeks, wearing a slightly disheveled school uniform: white oversized hoodie with rolled sleeves, short red pleated skirt hiked up, black thigh-high stockings with garters. Leg and feet focus: intricate details of bare feet, one foot resting on worn armrest of old cracked leather armchair, other foot gently touching cluttered floor, wearing simple white panties subtly visible. Dynamic low-angle shot emphasizing legs and intimate positioning. Posed sitting in a large, weathered leather office chair in a cluttered Dad's home office: hunched forward, one knee pulled tightly to her chest, hugging leg affectionately, chin resting tenderly on knee, creating vulnerable embarrassed expression. Blushing deeply with shy averted gaze, exuding innocent awkwardness while browsing on glowing computer monitor. Detailed environment: authentic cluttered home office aesthetic - wooden desk covered in scattered paperwork, pens, sticky notes, mechanical keyboard, wireless mouse, multiple monitors displaying coding windows, empty coffee mugs, tech gadgets, dusty bookshelves, closed vertical blinds casting dramatic light rays, warm orange sunset hues mixing with cool blue interior lighting, realistic texture on cracked leather chair with visible wear and stitching. ultra-detailed textures, photorealistic skin rendering, natural body proportions, soft bokeh background, depth of field, moody cinematic lighting, dimly lit, atmospheric perspective, professional color grading with warm-cool contrast, subtle film scratches and dust particles for authentic amateur aesthetic, the soft fabric of her white panties is barely visible between her legs.
>>1639998 >>1639995 ради чистоты эксперемента сгенерил на вф отсюда >>1639734 говорю что нода хуйня говна, как и вф.
чел походу так и не догадался отключить негативы и чинил то что модель срала ему в гены новой нодой, но нюансов он не знал, а потому в новой ноде подключение негатива обязательно.
ну и нахуй там семплер симпл и почему именно он и Flux Resolution Calc я хуй знает, на 3 мп не погенить там лимит же в 2.5
>>1639998 здесь в общем то хуйня а не скинтон, неправильная коррекция, смуглый скинтон на не смуглой в реале коже
на этом >>1639991 пике цветокор более естественный и в котором часто порно снимали, но цвет наверняка можно менять через настройки json либо через настройки той же ноды если понимать как они работают
Отключение негатива портит картинку. Здесь особенно заметно >>1639957 Наваливает шумов, руинит освещение. Челу понравился побочный эффект менящий сцену, но это черипик плюс когда качество настолько деградирует в этом нет смысла. Отключение негатива делает освещение менее реалистичным, подвыжженым, это и на арфе слабо но заметно было
ну вообще такой какой должен быть цвет тут, по крайней мере такой какой запромчен, с хай контрастом, при чем тут реал непонятно, у неё что не может быть кожи темнее, а если дарк скин пропишу... надо будет светлый отдельно пропишу фаир скин, а нода делает хуйню и обесцвечивает весь арт а не скинтон только буквально шлет нахуй все промпты освещения и цвета,
>>1640023 1 без ноды, 2 с нодой, остальное все идентично как по мне хуй знает че там реалистично, нода просто высасывает цвета, и высвечивает изображение
>>1640042 Ты сколько степов юзал, 12? Ладно юзайте дроченый комфи вф с убогими цветами и грязью где факт нерабочего quality48 указывает что залупа работает некорректно и не оптимально. А с этой нодой 48 степов работают
>>1640030 Отключение негатива восстанавливает половину детализации, которую пожирает зироаут и более точно рисует то, что написано в промте. Промт выкладывал тут >>1637609 → можешь сам убедится, что с негативом на поверхности вихревые облачные узоры - не видны. Третья пикча - это сохранение цепочки с негативом и отключение ConditioningZeroOut, результат только подтверждает. В конечном итоге, каждый сам выбирает свой верный путь.
В ахуе с треда, особенно с детализации >>1639084 →>>1639143 → Аноны не уходите из треда, держите его на таком уровне. Впервые за всё время тред криворуких хуесосов превратился в во что-то боее солидное. Ещё чуть-чуть и тред даже посоревнуется в качестве пикч с другими ии тредами.
Прикрутил к Flux2 9b LLM ассистента который хуярит адовые промпты в json. Теперь не надо корпеть над промптом и искать термины. Но блядь. Эта хуйня вобще никого не знает.. Пришлось LLM захардкодить обязательную декомпозицию персонажей, но всё равно не походит. Что теперь, эдитом всё ебашить? Или есть уже чекпоинты с примесью косплея?
>>1640208 плюс какой шел у креи там датасет селеб брали с их золотых годов больше, самое то для прона В идиотграм таки больше скуфограм с бабками (бля развидеть бы Бритни Спирс)
>>1640157 Энханс через гемму 4 31 с твоего промта выдает хтонический треш. И вчера вот с этой >>1639957 пики снимал промт - получалось такое же. Тут и гемма похоже параша и идеограм космос очень плохо рисует либо там свои никому не известные тэги и слова нужны.
>>1640295 >>1640305 Сейчас можно и в Мусуби. Некоторый плюс, что подойдут комфи-файлы. Но это с другой сторон уже сразу 8фп скейлед. А тренировать на таком... Ну такое. И мне после Тулкита не получилось похоже настройки сделать. Т.е. трен пошел, но по итогу не понравилось. + течка памяти осталась жёсткая. Остался для Идео на Тулките.
>>1640361 так я ж сказал я не старался, просто закинул тот промт, в жсон не переделывал, текст че там написано в промпте не читал, на выходе говно как тут >>1640309 не получил, забил болт
>>1640409 так подожи клейн пососал тут тут попахивает предвзятостью (ну эт норма не осуждаю, без негатива и прочего)
при чем по всем параметрам начиная от геометрии самой планеты и её текстурой (это че за пиздец овал бля шакальный) заканчивая засветами ебаными какими то
ну вот итоги перетреньки, Варя Черноус теперь дома
{ "high_level_description": "A cinematic, high-budget sci-fi movie still featuring a sleek exploration spaceship gliding toward an elegant, sprawling space station, set against the backdrop of a colossal, swirling gas giant planet.", "style_description": { "aesthetics": "cinematic, epic, high-fidelity, atmospheric, futuristic", "lighting": "Dramatic sunlight creating high-contrast metallic rim lighting, soft ethereal ambient glow from the planet, subtle anamorphic lens flare", "photo": "35mm anamorphic lens, wide-angle 2.39:1 aspect ratio, shallow depth of field, authentic film grain texture", "medium": "photograph", "color_palette": ["#FFBF00", "#F5F5DC", "#008080", "#C0C0C0", "#0A0A0A", "#FFD700", "#4A4A4A"] }, "compositional_deconstruction": { "background": "The deep void of space dominated by a massive gas giant planet with swirling atmospheric bands of amber, cream, and teal, encircled by a sharp, thin ring system.", "elements": [ { "type": "obj", "bbox": [100, 300, 900, 950], "desc": "A colossal gas giant planet with complex, swirling storm bands in shades of amber, cream, and faint teal.", "color_palette": ["#FFBF00", "#F5F5DC", "#008080"] }, { "type": "obj", "bbox": [250, 280, 650, 980], "desc": "A sharp, thin, translucent ring system encircling the gas giant, catching the light of a distant star.", "color_palette": ["#C0C0C0", "#F5F5DC"] }, { "type": "obj", "bbox": [300, 550, 700, 900], "desc": "A sprawling, elegant space station with flowing, organic architectural curves and intricate modular segments.", "color_palette": ["#C0C0C0", "#E0E0E0", "#4A4A4A"] }, { "type": "obj", "bbox": [400, 650, 550, 850], "desc": "Warmly glowing observation decks integrated into the space station's structure, emitting a soft golden light.", "color_palette": ["#FFD700", "#FFA500"] }, { "type": "obj", "bbox": [350, 750, 650, 880], "desc": "Delicate modular arrays and antenna lattices extending from the station's main hull.", "color_palette": ["#C0C0C0", "#808080"] }, { "type": "obj", "bbox": [450, 150, 550, 450], "desc": "A mid-sized exploration spaceship with a sleek, aerodynamic, functional metallic hull, positioned in the mid-ground.", "color_palette": ["#A9A9A9", "#C0C0C0", "#2F4F4F"] }, { "type": "obj", "bbox": [480, 150, 520, 220], "desc": "Glowing amber plasma thrusters at the rear of the exploration ship, creating a bright directional light.", "color_palette": ["#FF8C00", "#FFBF00"] }, { "type": "obj", "bbox": [50, 50, 120, 120], "desc": "A brilliant, distant star acting as the primary light source, casting sharp shadows and intense rim light.", "color_palette": ["#FFFFFF", "#FFFACD"] }, { "type": "obj", "bbox": [100, 100, 500, 600], "desc": "A subtle, horizontal blue anamorphic lens flare stretching across the frame.", "color_palette": ["#4682B4", "#B0C4DE"] } ] } }
>>1640433 > попахивает предвзятостью субъективностью мб? я всегда клейн считал нефотореалистичным из за паттернов и искуственных текстур, но суть в том, что он хотя бы пытается в реализм, в то время как идеограм чисто digital art концепт рисует, когда в настройках стоит photo
эта однобокость моделей локальных заебала, одни сцены может реалистично, другие лепит в убожественном виде игнорируя стиль промт
>>1640452 >не смотрел правильно сделал, эта такая аналоговнетная залупа, где доктора хауса играет Облохастин, он в сериале в энтам вообще нормально не разговаривает а орёт что-то типа ГОЙДААААА!!!! всё время, вокруг этих воплей вообще всё собрано, остальные персонажы играют роль мебели, Расмус твоя тоже.
>>1640455 >эта однобокость моделей локальных заебала, одни сцены может реалистично, другие лепит в убожественном виде игнорируя стиль промт
это норма, ты же не сможешь локально поднять какой нибудь грок имаген в полном весе (если бы такой был высран нам, я думаю там даже кванты хуй поднялись бы) ты посмотри на флюксу, модель стала чуть больше по обьему требуя более лучшее железо, чем какая нибудь анимная хуита, и все, нахуй никому не сдался. полторы лоры да вф на весь цивит. мы хотим все и дохуя но чтоб локально запускалось при этом
а пока так не получится по тех причинам и для этого нам даны лоры, натренил на кадрах из космооперы и хоть стардестроер будет заходит на посадку на цитадель из масс эректа
>>1640457 В чем смысл твоего совета? он не отвечает на вопрос она у меня есть, но у меня не развернута и не настроена ллмка под промт генерацию, так что я юзаю этот готовый автопромтер, в котором вполне рабочий систем промт под ideogram. Феномен который я заметил не объясним, один и тот же джейсон на выходе меняет результат если подтягивается из ноды либо напрямую копируется в CLIP. Это напоминает Двухщелевой опыт блять
>>1640465 Я из такого превью и копировал JSON, потом вставлял его в CLIP напрямую, CLIP отсоединял от промтера - само по себе это изменение меняло генерацию, хотя не должно.
При этом если возвращать подачу из промтера - генерация восстанавливает именно тот кадр который был, т.е. какого то изменения в подаче текста нет.
>>1640361 Да вы уже заебали со своим реализмом. Когда Д. Лукасу задали вопрос - апачиму у вас в фильме ЗВ лазиры и взрывы издают звуки, все гарит и взрыватса, этажи космас и вообще нириалистична! На что он ответил - идите нахуй, я снимаю красивое кино, а не унылую научную документалистику.
>>1640347 >>1640361 >>1640399 >>1640409 Это все красиво, конечно. Только основной вопрос был не об этом. А вопрос таков: на данный момент в идеограм есть 3 варианта гена картинки: через ConditioningZeroOut в негатив, без ConditioningZeroOut в негатив и пустой негатив. Все 3 варианта выдают разную картинку. Пока что, методом тыка,для себя определил, что ConditioningZeroOut в этой схеме вообще нахуй ненужон, тк пожирает мелкие детали и шатает промт. Остается вопрос нужен негатив или таки нет. Пустой негатив - это просто улучшенная версия дефолта с деталями, а вот включеный негатив дает совершенно другую картинку. Что думает уважаемое сообщество по этому поводу?
>>1640494 В оригинальном коде diffusers негатив вырезан. Так и надо использовать его. А в дефолтном воркфлоу ЗероАут добавили походу потому что не понимали как эта нода работает, сделали как на SDXL.
>>1640494 Эти танцы с негативом по сути не влияют на изображение фундаментально. Не вижу смысла эту идею развивать.
Вот дефолтны вф с аурой 5, со включенным/отключенным негативом. Это одна и та же картинка с погрешностью в 1 степ. Одна и та же говеная картинка. Негатив не меняет говно, когда модель генерит говно. И ладно бы это был промт говно. Но в промте описаны photo параметры и навалена описательная часть. Просто именно эта область недообучена, поэтому выдает унылый кал
использовал huihui-ai/Huihui-Qwen3-VL-8B-Instruct-abliterated для жейсона, всё заебись описал подробно, даже белый плинтус на бело стене распознал, но сука все координаты против часовой стрелки на 90 градусов смещены, то есть то что справа должно быть внизу. как эту хуйню крутить?
>>1640508 > huihui-ai/Huihui-Qwen3-VL-8B-Instruct-abliterated он порно промты генерит? насколько он ризонящий и в целом умный стабильный? через что подключал?
>>1640508 У меня тоже хуйхуй на полшестого путается в боксах.
>>1640473 Ну значит промпты разные в конечном итоге. Может, он через лапшу отдает структурированный промпт, а через copy одной строкой и разница в этом.
>>1640506 Влияют >>1640157 Это сделано на одних и тех же настройках без лор, которые тоже в генерацию накидывают. И я тебе могу еще с десяток сравнений накидать, вчера сидел, тыкал настройки и сравнивал картинки.
>>1640508 Скайнет предлагает проблемы с распознаванием ориентации в exif: Вместо стандартного Load Image используйте ноду, которая умеет принудительно сбрасывать и выравнивать EXIF-ориентацию перед тем, как подать картинку на вход в Qwen.Установите через ComfyUI Manager набор нод ComfyUI-MagickWand или ComfyUI-Essentials.Добавьте ноду ImageMagick Auto Orient (из MagickWand) или аналогичную ноду автоматического выравнивания.Пропустите вашу картинку через неё, а затем уже подавайте её выход (IMAGE) в инференс Qwen. Модель начнет видеть картинку ровно так же, как её видит сама операционная система. Или крутить самому вручную нодой rotate какой-нибудь перед нодой ллм.
>>1640531 Тоже медленно. Я думаю такова реализация поддержки ллм в комфуй. Llama.cpp и прочие лмстудии просто летают на тех же моделях (но в ггуф) или тяжелее. Если запускать параллельно и Комфи и ллм интерфейс, то будет битва за норму врам. Я так и не решил это. Хз.
>>1640547 зарешало порно с селебани, жури сами погенерили прона и завысили балы, чисто как анима хентай фабрика ток на реальных персах для среднекачественного прона
>>1640531 Я тут тесчу с API гугла gemma 4 31B, т.к. flash 3.5 перегружен по жизни. В сравнении даже с gemini flash 3.5, gemma 4 выглядит как кал, в промт энхансе, с точки зрения образов, фантазии и композинга, да и тэги подбирает будто бы хуже. Получается говно на гемме 4. А это еще не квантовка локальная. Получается в локалке ллм лучше геммы для промтинга и видения изображения вообще нет ничего? Удручает
>>1640537 ну не, нахуй эту поебень, я столько не выдержу ждать. лучше в лмстудии и комфи поперемнно дрочить кнопки нужно ток понять как насрать в системный промт чтобы не проёбывал ничего. можно порыться в этой ноде и там спиздить по сути
>>1640569 > нужно ток понять как насрать в системный промт чтобы не проёбывал ничего. можно порыться в этой ноде и там спиздить по сути На. из caption_schema.py Параграф DENSITY HIGH по желанию, он переключался кнопкой в ноде. За это скажи какую лучшую локальную ллм с ризонингом и художественным воображением можно вместить в 16gb что бы получать крутые промты а не сухой рэндомный высер.
You are an expert prompt engineer for Ideogram 4, an image model trained on \ structured JSON captions. Convert the user's idea (and the reference image, if one is given) \ into ONE Ideogram 4 caption JSON object. Output ONLY the JSON — no markdown fences, no commentary.
SCHEMA (key order matters): { "high_level_description": "<one or two sentence overview of the whole image>", "style_description": { // include this block only when style is meaningful. Pick EXACTLY ONE of photo / art_style. // Photo order: aesthetics, lighting, photo, medium, color_palette // Non-photo order: aesthetics, lighting, medium, art_style, color_palette "aesthetics": "<visual mood keywords>", "lighting": "<lighting description>", "photo": "<camera/lens specs, e.g. '35mm, f/1.4, shallow depth of field'>", // photos only "art_style": "<style description>", // non-photos only "medium": "<photograph | illustration | 3d_render | painting | ...>", "color_palette": ["#RRGGBB", ...] // up to 16 UPPERCASE hex codes, optional }, "compositional_deconstruction": { "background": "<description of the scene/environment>", "elements": [ { "type": "obj", "bbox": [ymin, xmin, ymax, xmax], // integers 0-1000, origin top-left, optional "desc": "<detailed description of this object>", "color_palette": ["#RRGGBB", ...] // up to 5 UPPERCASE hex codes, optional }, { "type": "text", "bbox": [ymin, xmin, ymax, xmax], "text": "<the literal text to render>", "desc": "<how the text looks: font feel, weight, treatment>", "color_palette": ["#RRGGBB", ...] } ] } }
RULES: - high_level_description and compositional_deconstruction.background are required; always fill them. - Break the scene into concrete elements. Give each a bbox on the 0-1000 grid; place them where they belong (rough placement in hundreds is fine). The grid is [ymin, xmin, ymax, xmax], top-left origin. - Use type "text" for any rendered words/letters and put the exact words in "text". - All hex colors UPPERCASE #RRGGBB. <=16 colors in the style palette, <=5 per element. - Choose photo vs art_style from the idea; if it reads photographic use "photo", otherwise "art_style". - Return a single valid JSON object and nothing else."""
ELEMENT DENSITY: HIGH. - Decompose the scene as granularly as possible. Give EVERY distinct object its own element with its own bbox — never merge several objects into one region. - Example: a table holding a vase becomes TWO elements (one bbox for the table, one for the vase), not one. Split groups, sets, and clusters into individual elements as well. - Include small and secondary objects (props, accents, background details) as their own elements with tight bboxes. Aim for a thorough, exhaustive breakdown of the composition."""
>>1640537 >то будет битва за норму врам. Я так и не решил это. Больше видеокарт. Правда, что-то я не вижу в ноде с ллм-дегенерацией выбора GPU, но это же комфи.
>>1640618 Если на кляйне генерить и показывать юзерам только макро с божьей коровкой, а на zit провода и спицы, то вывод у юзеров будет очевиден. Хз я сам не всматриваясь там им натыкал хаотично от балды, вот тебе и рейтинг
>>1640620 Если быть точным, они реально очень близки по однобокости. Только ZIT из коробки дообучен рисовать поразительный реализм. Но по образам, художественности и наполненности она такое же дно как клейн. Клейн выдает лучшую цветовую эстетику и общий свет, зит рисует грязный реализм. То что у них одинаковый рейтинг - близко к правде.
>>1640547 Пиздеж какой-то. Играюсь сейчас с креа и с бигаспом новым (который тьюн клейна) и бигасп куда точнее слушается промпта по сравнению с креа, как минимум на длинных натур текстах.
Креа реже слушает указания по поводу позиции объекта в кадре, хуже понимает некоторые взаимодействия персонажей.
Правда если сравнивать с обычным клейном, то там да, креа будет впереди, т.к. с анатомией реже косячит.
>>1640626 не успели, юристы уже готовят иски, Нинка не отпустит заюз своих айпи даже если это туалетная бумага с марио в сельском сартире в глуши без связи
Выше уже кидал и писал. Это не турбо версия, нужно где-то 20-40 шагов, кфг около 4х (можно примешать экстракт лору от клейна на низком весе, можно будет шагов в 16-20 сойтись ценой чуть большей слопности) Отлично знает анатомию и нсфв.
Эдит возможности подрастерял, автор обещает, что эдит будет, то потом.
Блин в дифужн треде может кто то посоветовать локалку для хорошего промтера помимо gemma 4 31b? Нет разве каких то специализированных лучше понимающих изображение на вход и описательную часть текста на выход? ЛЛМки пургу городят в рекомендациях шизоидно-отсталую по времени
>>1640677 >Комфи обновлял Если у тебя Desktop версия, выбери в настройках инстанции чтобы была nightly последняя ветка с гитхаба при обновлении (не stable).
>>1640663 Где я бесплатные api высру. У гемини только gemma 4 31b работает нормально. Всё остальное блочится. Тыкаться в браузере в чат и подсовывать систем промты заебало. Хочется прикрутить уже свое, но не знаю че. Gemma 4 31b даже не влезет в 16vram, а квантованная днище совсем наверное
Гемини упорно рекламит Phi-4-Reasoning-Vision-15B Я хз что это
>>1640687 Флеш стоит копейки на опенроутере. Вот как выглядит рефайн промпта. Даже если каждую генерацию перегенериваешь промпт, за день рублей 10 потратишь.
>>1640662 Черипик. Рэндомную хуйню простую любая модель рисует, особенно если выбрать удачное. Когда пытаешься нарисовать то что хочешь, получаешь шершавого, если конечно не собака-говноед.
>>1640701 И так их использовал, gemini flash 3.5 потому что не блочится от подсовывания .md с сис промтом.
Но поюзал ноду с API ллм, которая сразу подгружает в вф по клику, и понял что это удобней и быстрей. Захотелось своё иметь. Но похоже все локальные хуже чем даже gemini flash 3.5. А flash 3.5 по моим меркам это тоже говнина тупорылая бездуховно-ограниченная, с хуевой фантазией и способностями. Вот я и задумался, а нет ли локалок, но заточенных под промт энхасинг, придумывание сцен, образов, с пониманием композиций и так далее. Такая могла бы быть луче чем бесплатная корпоратка.
Никто не отвечает, видно такого нет, и лучше всех gemma 4 31b. Но она и так бесплатна через Google api пока что. Вот только результат не особо радует
>>1640706 Давай контрольный пример. Усреднённый какой-нибудь. Картинку и то что выдаёт онлайн ллм со всеми твоими накрутками и хаками, но без ручной правки результата. Мне просто интересно на что ориентироваться. Я всегда использовал мелкие локальные ллм, а теперь задумался.
>>1640724 Я не спорил, что зит генерит лучше освещение, я писал про реализм - это и выражается на твоих примерах. Однако они в возможностях, разнообразии и сложности сцены примерно одинаковые. Только клейн еще пластиковый, а ЗИТ реализм наваливает. Всё. Но наверняка у клейна найдется какое то маленькое преимщество.
>>1640765 > в флюксе текстуры есть Текстуры пластика? С реалистиком у зетки всё получше. Флюкс даже бабу никогда не видел, сплошные пластиковые мутанты.
>>1640771 Кем-то тренятся, это не про мою видюху. Да и смысла особо не вижу, там главный плюс в датасете, а с лорами можно и зетку, там сравнимое кач-во и скорость.
Я ток не поойму, как крею пробивать на коротких казуальных промптах
текст энкодер, жрет любой квен3 и квен3вл, хоть от кляйна, хоть бф16 заливай первый это тот что стандартно предлагают, остальное разные аблитерации и унцензоры которых насрали на хугфейсе
>>1640876 Однозначно да. Промптинг похабщины несколько капризный, но может доедать жсоны за ИГ, за обе щеки хрумкает. Не модель строгать шедевры для лувра, понятное дело, но в нс4в царит
>>1640701 >>1640657 >>1640694 >>1640663 Тут не в локалке и модели дело, а в промпте и инструкциях. Гемма тебе что угодно и как угодно напишет на отличном уровне, важны лишь инструкции вот конкретно под эту задачу, где то были хорошие, но я всё проебал
пообучал лоры на krea 2 base, в целом неплохо, похожесть людей очень высокая. но датасеты видимо стоит чистить от лишних деталей, а то и их может запомнить и вставить в кадр.
>>1640925 >результаты мягко говоря всратые с базы выходят >>1640935 >так у базы еще разрешение ужатое до 1024 А вот это может быть пиздец хуево для дальнейшего файнтюна, если там все качество от тщательной задрочки РЛем на дистилляции. Может нужна раздистиллиная база, как с зеткой.
>>1640938 >но датасеты видимо стоит чистить от лишних деталей Маски лосса.
>>1640920 Ну давай найди пж, что за инструкции Сис промт для идеогама из ноды неплохо работает, но больше нацелен для адаптации под json формат модели. У меня была идея дополнить его отсебятиной, что бы улучшить промт, но мой опыт с ситем промтом под энханс - отрицательный. Будто бы любые попытки уточнить как и что описывать оборачивались рэндомной хуетой на выходе без качественного улучшения, не говоря про однобокость. Что такого универсального прописать, что бы это явно улучшало выхлоп в любвх идеях вообще не ясно. К тому же есть еще такой факт: photo, lighting, aestetic - исключительно рэндомные поля, заполняя которые чем попало можно только ухудшить картинку, а бывает что нет ПЛЮС к этому, идеограм в разных сценариях выдает разный стиль "реализма", даже если пропачо photo, и наваливание тэгов почти на это не влияет либо ухудшает. Тем не менее именно gemini flash 3.5 сгенерил промт тириона коношного, но возможно дело не в промте а в идеограме самом
>>1640968 >пидор ржал Я помню времена, когда при упоминании турбо лоры DMD2 рвало пукан чуть ли не у всего треда. Мне доказывали, что ускорялки это зло, они портят картинку, убивают разнообразие. Сейчас все сидят на дистиллятах и молчат. Кто генерит базой? Никто. Так что не слушай никого, особенно здесь. Времена DMD2 прошли, но отношение местного сообщества помнится.
>>1640973 >photo, lighting, aestetic Кстати, а может быть такое, что они не про все поля нам рассказали? Может там еще несколько типа: disable_block, swith_nsfw, quality, и т.п. Ну, ладно, не nsfw, а что-то еще расширенное по списку наверняка спрятано. Пробуйте сами добавлять что-то от себя в текстовой json. Может что-то нащупаем?
>>1640769 > Текстуры пластика? У true v2 почти нет пластика, он будто бы во всем превосходит клейн дистил, сделан на базе и работает на 20-25 шагах. Через него текстуры и наваливаются, включая кожу. Глаза через раз может парашить, но когда нет - практически как в зит по реализму. Этим и можно рефайнить. Если бы у зита был рефайн как у клейна, он бы был топ рефайнером, но разрабы конечно хуй че дадут. Он бы в теории мог любой слоп превращать в high end фотореализм.
>>1640743 Потому что это хуита дырявая у меня не заводиться, 2 недели сука ебусь а все толку нет!!!! Пичёт люто просто! Ни сити ни калькиус нихуя не могут сделать, их уже завалили реквестами, а толку, дармоеды сука ленивые!
Я ненавижу нейросети. Тупорылая бездарная хуйня приводит к тому, что я вдобавок сам чувствую себя тупорылым.
Кадр из фильма: Викторианская эпоха. Clive Owen в роли знатного персонажа на людной улице города. Сюжет, сцену и остальных персонажей придумай сам. Должно быть правдоподобно и киношно.
gemini 3.5 flash на энхансере, 1 трай
идеограм не знает клайва оуена, пиздец знание селеб, видно завезли тянок чисто для дрочил
>>1641007 Думаю комментарии излишни. Хотя добавлю: Хуета ебучая. Вы не контролируете нихуя, она просто рисует 1girl и определенные сценарии так как хочет в фотореализме, всё остальное рисует как кусок гнилого говна рисованного всратого. Чисто более мощная анима под рефайн в лучшем случае.
>>1641007 так его никто не знает, чухан какой-то оно и аннасофию робб не знает, за три промта разных выдало бабу с очень страшного кино, ну почти робб и альбину джанабаеву
>>1641016 > аннасофию робб не знает ты сравнил тоже какую то зумерскую насадку на член, и топ тир актера гпт победил очередную локалку, идеограм, который только черепиком может что то интересное
>>1640968 это идеограм >И есть ли вообще смысл выяснять какой энкодер лучше?
раньше моделям похуям было какой у тебя кодер, сейчас с этими умными фильтурами, теоретически текст кодер может маркать тебе запрещенку на которую трегирится модель, не пропустить промпт он не может, не та функция, но встроенные фильтры самой языковой модели могут маркать эти токены которые модель потом или отбросит или проигнорит или даст сафети фильтр. вот как первый стандартный старательно пытается обойти секс ковгирл
Qwen3VL-8B-Uncensored-HauhauCS-Aggressive-Q8_0 вот этот показался самым оптимальным, над бф16 попробывать но есть еще пара ему не уступающих, над сильнее посравнивать
Ля какая таки крея сочненькая, надо все веса посохранять пока их всех там судебными исками не ебанули и веса не поудаляли обратно, это ж чисто анима ток с селебами
>>1641030 samanima попробуй, чудес не ожидай на 4 vram, но по качеству она может быть лучшей из всех других квантованных вариантов, клейн или зит из за квантовки под 4gb настолько сильно теряют в текстурах, то кожа получается как гладкий пластик с ворсинками - очень хуево, кроме того квантованный клейн с nsfw лорами просто уничтожает анатомию, практически 90% генераций будет со сломанной анатомией всратой
samanima хоть какую то текстуру пытается и освещение +- норм, но там много слопа будет, и долго, но что то погенерить сможешь
>>1641034 креа 2 генерит бедность как флакс, и резиной тоже отдает на коже, это модель для дрочил, не хочу даже качать, актер мне не особо всрался, просто подметил
>>1641041 сказал как что то не очень далекое и простое, потому что фотореализм с пиздой доступен уже год если не больше, так что новая модель умеющая в nsfw реализм это просто как новый ролик порно, при этом эти сценарии вообще никак не бенчмаркают модель, не отражают никакого прогресса, т.к. голая пизда это одна из первый вещей которая легко реализуема в диффузии
>>1641041 в треде нудки не интересные, покерфесы уровня клейн, ноль живой эмоции, не цепляет вообще, одна и та же мертвая эмоция на все картинки, слишком циклитесь на сиськах и реализме, забывая о том, что доставляет взгляд, язык тела это модель и никакие ббоксы вам не сделают ваш хуй не понимает что такое эстетика, так что и в голове это атрофировалось
>>1641056 Я nsfw на идеограме не гонял, так и не понял какой готовый рецепт для самого лучшего результата, там и с сигмами 2 каких то хака альтернативных, и отдельный WF какой то с No safety filter тэгом, и лоры еще какие то. Лень наваливать. Напиши мне рецепт свой
>>1641051 >покерфесы уровня клейн поржал, т.к. у флюкса 2 и кляйна в том числе вариативность эмоций лучшие из всех моделей на данный момент или ты скиллишью, или просто троллишь
>>1641085 > вариативность эмоций лучшие Они не реалистичные и топорные, а ты это хаваешь, качество не в том, сколько инструкций она распознает, а насколько тонко уточняет. Клейн абсолютно не преемлемое говно - если ты с ним что то выдрачиваешь, у тебя проблемы с видением в целом. Как минимум потому, что тебя устраивает слопные изображения клейна.
>>1641113 в отличии от тебя - фанбоя говна, я всё объективно оцениваю, пока ты усираешься от хейта, у меня все модели есть и я вижу недостатки каждой. Ты бы хоть не позорился выкладывать такой кал на пикреле с двумя брёвнами с нулевой мимикой и качеством полторашки. Твоё мнение нихуя не стоит
>>1641139 Ты не понимаешь что такое мимика, и со сдвигом по фазе в принципе. Ты генерил голимый слоп на flux DEV и сравнивал его с фотореалистичными моделями, приговаривая что это вкусовщина. Ладно, хули с тобой спорить. Генерь сам для себя свой слоп какой хочешь. Но клейн уже почти умер, имей ввиду. Даже ZIT более актуален чем t2i клейн
>>1641142 >руминирующий шизоид с фиксацией на своём ненавистном кляйне называет кого-то шизоидом лечи свою персеверацию и не трясись так, а то только хуже себе сделаешь
Эта идеограмовская грязь и искажения лезущие в глаза просто заебали, он только в 1girl и может еле как чистую картинку выдавать. Причем там при понижении CFG искажения снижаются, но вместе с ними приходит слопизация, упрощение освещения. При этом ни то ни другое не на приемлемом уровне
кто как настроил последний комфи в плане кэширования и работы с памятью? у меня 16 vram/64 ram, какие наилучшие настройки для этого? пока включил только --high-ram, текстовый энкодер в krea стал почти мгновенно реагировать на изменение промпта. но изменение веса лор вызывает постоянные чтения с диска, лучше бы всё это в ram нормально кэшировалось, как в более старых версиях комфи.
>>1641199 пик1 37662645039201 { "high_level_description": "A cinematic movie still from a period drama set in 1900 New York, capturing Shia LaBeouf as Dr. John Thackery and Emma Watson as Lucy Elkins having a quiet, emotionally charged conversation on a crowded city street.", "style_description": { "aesthetics": "cinematic, period drama, gritty, atmospheric, historical realism, melancholic", "lighting": "soft, natural overcast daylight with subtle directional shadows, creating a rich filmic look", "photo": "35mm anamorphic lens, f/2.0, shallow depth of field, visible film grain, cinematic color grading", "medium": "photograph", "color_palette": ["#1C1D21", "#3E424A", "#8D7F73", "#D2C5B6", "#4A3B32", "#100F11"] }, "compositional_deconstruction": { "background": "A bustling, softly-blurred New York street in the year 1900. Pedestrians in period-accurate Edwardian clothing, bowler hats, and long coats walk along cobblestone streets. Vintage brick storefronts and horse-drawn carriages are visible in the hazy, atmospheric background.", "elements": [ { "type": "obj", "bbox": [120, 150, 950, 530], "desc": "Shia LaBeouf as Dr. John Thackery, standing in profile-to-three-quarter view. He has slicked-back dark hair, a prominent thick mustache, and an intense, weary expression. He is wearing a dark, heavy Edwardian wool overcoat with a high collar over a white shirt.", "color_palette": ["#1C1D21", "#FFFFFF", "#4A3B32"] }, { "type": "obj", "bbox": [220, 520, 950, 880], "desc": "Emma Watson as Lucy Elkins, looking up at Dr. Thackery with an earnest and concerned expression. She has pale skin, expressive dark eyes, and dark hair partially covered by a modest dark Edwardian bonnet. She is dressed in a dark, structured period coat.", "color_palette": ["#100F11", "#D2C5B6", "#3E424A"] } ] } }
пик2 403422884952417 { "high_level_description": "A dramatic cinematic film still from a historical drama set in 1900 New York, capturing an intense and furious argument between Johnny Depp as Dr. John Thackery and Emma Watson as Lucy Elkins on a crowded street.", "style_description": { "aesthetics": "cinematic, gritty, dramatic, historical drama, intense emotion, realistic", "lighting": "natural overcast daylight, soft shadows, high contrast", "photo": "35mm anamorphic lens, shallow depth of field, realistic film grain, f/2.8", "medium": "photograph", "color_palette": ["#2B2521", "#4A403A", "#8C7D70", "#D3C6B6", "#1C2D37"] }, "compositional_deconstruction": { "background": "A bustling New York street in the year 1900, with wet cobblestones, vintage storefronts featuring hand-painted signs, and blurred figures of pedestrians in period clothing and horse-drawn carriages receding into a deep, misty perspective.", "elements": [ { "type": "obj", "bbox": [150, 120, 900, 500], "desc": "Johnny Depp portrayed as Dr. John Thackery, looking disheveled and enraged. He is wearing a dark, heavy Victorian wool overcoat, a rumpled white high-collar shirt, and a dark cravat. His dark hair is messy, and he is gesturing aggressively with one hand, mouth open in mid-shout.", "color_palette": ["#1C1A18", "#FFFFFF", "#3D3530"] }, { "type": "obj", "bbox": [200, 480, 950, 860], "desc": "Emma Watson portrayed as Lucy Elkins, standing defiantly with an angry and hurt expression. She has her hair styled in a Gibson Girl updo, and is wearing a cream-colored high-neck Edwardian blouse, a dark long skirt, and a matching vest. Her posture is tense as she glares back at him.", "color_palette": ["#EAE3D2", "#252120", "#8E7F72"] } ] } }
Как заставить идеограм схватить за горло и замахнуться? На текст энкодере стоит Qwen3VL-8B-Uncensored-HauhauCS-Aggressive-Q8_0.gguf
в промте описывающем действие: His left hand is tightly gripping the woman's throat, while his right arm is cocked back, mid-swing in a threatening gesture.
Не работает нихуя. Сигма хак подключать или что? Сейфти фильтер то не выстреливает. Идеограм не умеет в агрессию?
>>1641217 Я не могу обработать твой запрос, анон, так как он содержит сцены жестокости и насилия. Если у тебя есть другие запросы, не связанные с подобной тематикой, я с радостью отвечу.
ббоксами руки прописывать никакого желания нет и у тебя за горло не схватил даже, то есть ты тоже хуево значит описываешь, в ином случае модель всё сразу понимает и рисует
>>1641261 Верно, но всегда чего то не хватает, и черепикнутое качество, в основном кал слопный лезет в 8 из 10 случаев. За горло не хватает не пиздит бабу как выяснилось
>>1641259 Ты черипикнул всратый кадр, в остальных ничего не работает. Это не качественный подход, просто натуги с тем, что не работает.
>>1641261 А вот теперь так 10 сидов подряд, дорогуша, и вот тогда будет ясно-понятно на что способна модель. Ловить блох и черепикать мы все тут мастера.
>>1641273 ну я не черрипикал, взял твой сид и промт прост чуть подправил в системных графах где свет и эстетика с кадром и все остальное не трогал все равно качество ранее недостижимое для локалок, ни одна модель сейчас локальная даже близко к такому не подойдет
>>1641290 > ТПЕ-доллс, не живые. Ты очень странно понимаешь реализм. Ты очень странно понимаешь 4gb модель. Там текстура кожи чуть ли не лучше чем у klein 9b. Такое ни одна модель на 4gb не способна. 1 хайрез рефайн и получается полный фотореализм
>>1641291 Дело не в этом, и я не в обиду тебе. Кожа неплоха, прямо скажем, но в сравнении с кляйном что угодно будет лучше) Они просто не живые, у них нет настроения, нет эмоций.
>>1641282 Вообще по пикам тоже судят и судить будут. Потому что даже у GPT2 в арсенале есть несколько уровней стиля реализма. Иногда он рисует откровенный semi-real, на запрос абсолют синемы. Иногда он рисует пикрил >>1641021 Так что глупо было бы судить о модели по стабильности в сидах. Но вот уровень качества в разных сюжетах имеет значение.
>>1641360 Запускается пиздец долго, тормозит. А потом вот запустил батч, смотрю в консоль - а там такое. Ещё и стучит куда-то. Я процессоры не генерю, но всё равно неприятно, что в этом калище ещё и зонды.
>>1641382 > пик > стучит куда-то Ты же конечно не оставил это просто так, и, надеюсь, навирешаркал, да? Со всеми доказательствами, как Комфианон собирает со всех промтеки. Ведь да, принесешь?
>>1641420 Ты обрати внимание на то, что коннект не открывается, потому что этот кал не может выделить порт. None в ошибке. Так что мне, в целом, похуй, куда оно стучит - всё равно не достучится. Но факт остаётся фактом, это тормозной, глючный кал с зондами. Исправлять ошибки в этом кале, чтобы зонд достучался, а потом нюхать трафик, куда именно оно стучится и что шлёт? Нахуй надо.
>>1641303 та хуль тут говорить, тут буквально какието пара хейтеров идиотграма, и главное сидят, генерят и кидают гены с доказательствами что идиотграм соснул, та лучше бы жопы кидали чесн слово
вот сразу прокричали про черрипик когда запостил неприятное >>1641282 >>1641273 хотя какой черрипик если я буквально взял промпт и сид, удалил всякую хуиту из системного промпта, где цвет, стиль, медиум, добавил немного своего и нажал ген, никакие боксы не двигал, не смотрел че у него там в палитре, нихуя больше в промпте не дергал, да и это куалити48. это уже демедж контроль хейтеров какой то
Вот копиум такого масштаба что вселенная может треснуть буквально сравнить локалку с трилионной хуилой которую на дата центрах крутят, чел ну ты в разуме там не раз победил так давай, ставь локально и гень что хочешь.. а нельзя, ну пососал тогда бывает что побелать.
если че без негатива ананасы, я всегда за сравнения и критику, но то что выше похоже на хейт высосаный из пальца
>>1641142 >на flux DEV и сравнивал его с фотореалистичными моделями, приговаривая что это вкусовщина.
Ха, это я на FLUX.2 [dev] генерю и FLUX.2 [klein] 9B рефайню, а Ideogram 4.0 после тестов и экспериментов с sigmas, mu, std собирает пыль. Всё так и есть. Я тебе ещё тогда сказал, что тебе просто больше нравится один из видов слопа, чем другой. Ты под него уже заточен и другое не воспринимаешь. Потрогай траву. У кого глаза есть сами всё видят, в том числе достоинства и недостатки конкретных моделей.
>>1641613 4.jpg gpt - лучшая композиция, поза, освещение и задник 3.jpg и 1.jpeg крайне уебищные генерации, не легитимное сравнение, как минимум ИГ может намного лучше 2.jpg стало быть нб?
Ты еще небось генерил локалки на низком разрешении под выхлоп корпок? А ниче что они генерят в супер разрешении и потом сжимают? Иди нахуй короче. Разницы в 1girl с корпоратками щас нет если убрать задник и не учитывать стабильность
>>1641618 T2i - ideogram, anima и файнтюны, krea, zit для поднятия тонуса по настроению. Есть еще всратый hi dream с мультиреференсом, но там качество всратое, под рефайн клейном может пригодиться. Iti - klein 9b из корбки самый простой, остальные варианты не официальные дроченые, но могут работать в инпейнт или типа того
>>1641620 Не знаю, че ты так возбудился, хотя не можешь отличить великую банану от слабой гпт и не в курсе, что ИГ похуй на разрешение в первую очередь. Ниче не угадал.
А ИГ может лучше, я не черрипикал, там промпт был один и он не всем подошел. Приноси свои шедевры, ну или обсеры, я пиздеть с таким гонором не буду, я ж не ты.
>>1641623 Ты там главное сам не перепутай че ты там понаделал, выложив циферки по порядку и сувал один промт в диффузию и ллм агентам, что указывает на когнитивную дефекацию
>>1641631 Я вбросил пикчи без всяких понтов, он мне пишет "иди нахуй", командир треда нашелся ебать, не оценил мой калтент. И ты МНЕ пишешь что-то про снежинку? Давай сделаем так: иди-ка нахуй ты, а если чем-то недоволен - на пикабу, снежинка.
>>1641649 > нужно ли что то говорить Искажения идеограма не создают ощущения завершенности и сразу заметны. Заебали если честно, в основном в глаза лезут
>>1641613 Снова я, но посмотрел с ПК. - 3.jpg - Ideogram 4 (омерзительное качество у тебя) - 4.jpg - GPT2 (без изменений) - 1.jpg - Krea2 (шумы мыло гряз экранки) - 2.jpg - NB2
Озвучивай результат и выдавай приз. Ты сказал что 4.jpg это не ГПТ. Признай что перепутал, это GPT2. Поэтому это лучший шот среди всех. Именно гпт навалила больших и маленьких пальм, плотно заполняя задник
>>1641568 > тебе просто больше нравится один из видов слопа, чем другой. Чел, ты знаешь и видишь что модель не может нарисовать разрушения, но рисуешь слоп с молотком и осколками без динамики что создает гарантированный слоп эффект. Потом рассказываешь про вкус ко слопу. Не советую обольщаться и оправдывать себя, разница есть, пусть ты её и не видишь.